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总 HR 


短 短 几 年 间 ， 大 数据 就 以 一 日 千里 的 发 展 速度 , 快速 实现 了 从 概念 
到 落地 ， 直 接 带动 了 相关 产业 的 井喷 式 发 展 。 数 据 采 集 、 数 据 存储 、 数 
据 挖掘 、 数 据 分 析 等 大 数据 技术 在 越 来 越 多 的 行业 中 得 到 应 用 ， 随 之 而 
来 的 就 是 大 数据 人 才 缺 口 问题 的 凸显 。 根 据 《 人 民 日 报 》 的 报道 ， 未 来 
3 一 5 年， 中国 需要 180 万 数据 人 才 ， 但 目前 只 有 约 30 73 A. AFE 
达到 150 万 之 多 。 

大 数据 是 一 门 实践 性 很 强 的 学 科 ， 在 其 金字 塔 型 的 人 才 资 源 模型 
中 ,数据 科学 家 居于 塔 尖 位 置 , 然而 该 领域 对 于 经 验 丰富 的 数据 科学 家 
需求 相对 有 限 ， 反 而 是 对 大 数据 底层 设计 、 数 据 清洗 、 数 据 挖 掘 及 大 数 
据 安 全 等 相关 人 才 的 需求 急剧 上 升 ， 可 以 说 占据 了 大 数据 人 才 需 求 的 
80% 以 上 。 比 如 数据 清洗 、 数 据 挖掘 等 相关 职位 ， 需 要 源源 不 断 的 大 量 
专业 人 才 。 

迫切 的 人 才 需 求 直接 催 热 了 相应 的 大 数据 应 用 专业 。2018 年 1 月 
18 日 ， 教 育 部 公布 了 “大 数据 技术 与 应 用 ”专业 备案 和 审批 结果 ， 已 
有 270 所 高 职 院 校 申报 开设 “大 数据 技术 与 应 用 ”专业 ， 其 中 共有 208 
所 职业 院 校 获 批 “大 数据 技术 与 应 用 ”专业 。 随 着 大 数据 的 深入 发 展 ， 
未 来 几 年 申请 与 获 批 该 专业 的 职业 院 校 数量 仍 将 持续 走高 。 同 时 ,对 于 
国家 教育 部 正式 设立 的 “数据 科学 与 大 数据 技术 ”本 科 新 专业 ， 除 已 获 
批 的 35 所 大 学 之 外 ，2017 年 申请 院 校 也 高 达 263 所 。 

即使 如 此 ,就 目前 而 言 , 在 大 数据 人 才 培 养 和 大 数据 课程 建设 方面 ， 
大 部 分 专科 院 校 仍然 处 于 起 步 阶段 ， 需 要 探索 的 问题 还 有 很 多 。 首 先 ， 
大 数据 是 个 新 生 事物 , 履 大 数据 的 老师 少 之 又 少 , ERRA”: 其 次 ， 
院 校 尚未 形成 完善 的 大 数据 人 才 培 养 和 课程 体系 , 缺乏 “机 制 ” 再 次 ， 
大 数据 实验 需要 为 每 位 学 生 提 供 集群 计算 机 ， 院 校 缺 “ 机 器 ”; 最 后 ， 
院 校 没 有 海量 数据 ， 开 展 大 数据 教学 实验 工作 缺少 “原材料 o 
对 于 注重 实 操 的 大 数据 技术 与 应 用 专业 专科 建设 而 言 , 需要 重点 面向 网 
络 爬 虫 、 大 数据 分 析 、 大 数据 开发 、 大 数据 可 视 化 、 大 数据 运 维 工 程 师 
的 工作 岗位 ,帮助 学 生 掌 握 大 数据 技术 与 应 用 专业 必 备 知识 , 使 其 具备 
大 数据 采集 、 存 储 、 清 洗 、 分 析 、 开 发 及 系统 维护 的 专业 能 力 和 技能 ， 
成 为 能 够 服务 区 域 经 济 的 发 展 型 、 创 新 型 或 复合 型 技术 技能 人 才 。 无 论 
是 缺 “ 人 ” 缺 “ 机 制 ” 缺 “ 机 器 ”， 还 是 缺少 “原材料 ”， 最 终 都 难以 
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培养 出 合格 的 大 数据 人 才 。 

其 实 , 早 在 网 格 计算 和 云 计算 兴起 时 , 我 国 科 技工 作者 就 曾 遇 到 过 
类 似 的 挑战 , 我 有 幸 参 与 了 这 些 问 题 的 解决 过 程 。 为 了 解决 网 格 计算 问 
题 ， 我 在 清华 大 学 读 博 期 间 ， 于 2001 年 创办 了 中 国 网 格 信息 中 转 站 网 
站 , 每 天 花 几 个 小 时 收集 和 分 享有 价值 的 资料 给 学 术 界 ， 此 后 我 也 多 次 
筹办 和 主持 全 国 性 的 网 格 计算 学 术 会 议 ， 进 行 信息 传递 与 知识 分 享 。 
2002 年 ， 我 与 其 他 专家 合作 的 《网 格 计算 》 教 材 正式 面世 。 

2008 年 ， 当 云 计算 开始 萌芽 之 时 ， 我 创办 了 中 国 云 计算 网 站 
Cchinacloud.cn) (在 各 大 搜索 引擎 “ 云 计 算 ” 关 键 词 中 名 列 前 茅 ), 2010 
年 出 版 了 《 云 计 算 (第 1 版 )》，2011 年 出 版 了 《 云 计算 (第 2 版 )》， 
2015 年 出 版 了 《 云 计 算 (第 3 版 )》， 每 一 版 都 花费 了 大 量 成 本 制作 并 
免费 分 享 对 应 的 几 十 个 教学 PPT。 目 前 ， 这 些 PPT 的 下 载 总 量 达 到 了 
几 百 万 次 之 多 。 同 时 ,《 云 计算 》 一 书 也 成 为 国内 高 校 的 优秀 教材 ， 在 
中 国 知 网 公布 的 高 被 引 图 书 名 单 中 ,《 云 计算 》 在 自动 化 和 计算 机 领域 
排名 全 国 第 一 。 

除了 资料 分 享 ， 在 2010 年 ， 我 们 在 南京 组 织 了 全 国 高 校 云 计算 师 
资 培训 班 ， 培 养 了 国内 第 一 批 云 计算 老师 ， 并 通过 与 华为 、 中 兴 、360 
等 知名 企业 合作 ,输出 云 计算 技术 ,培养 云 计算 研发 人 才 。 这 些 工作 获 
得 了 大 家 的 认可 与 好 评 , 此 后 我 接连 担任 了 工信部 云 计算 研究 中 心 专家 、 
中 国 云 计算 专 家 委员 会 云 存 储 组 组 长 、 中 国 大 数据 应 用 联盟 人 工 智 能 专 
家 委员 会 主任 等 。 

近 几 年 , 面 对 日 益 突出 的 大 数据 发 展 难 题 , 我 们 也 正在 尝试 使 用 此 
前 类 似 的 办 法 去 应 对 这 些 挑战 .为 了 解决 大 数据 技术 资料 缺乏 和 交流 不 
够 通 透 的 问题 , 我 们 于 2013 年 创办 了 中 国 大 数据 网 站 (thebigdata.cn)， 
投入 大 量 的 人 力 进 行 日 常 维护 , 该 网 站 目前 已 经 在 各 大 搜索 引擎 的 “大 
数据 ”关键 词 排名 中 名 列 前 茅 ; 为 了 解决 大 数据 师资 荐 乏 的 问题 ， 我 们 
面向 全 国 院 校 陆续 举办 多 期 大 数据 师资 培训 班 ， 致 力 于 解决 “ 缺 人 ”的 
问题 。 

2016 年 年 末 至 今 , 我 们 已 在 南京 多 次 举办 全 国 高 校 /高 职 /中 职 大 数 
据 免 费 培训 班 ， 基 于 《大 数据 》《 大 数据 实验 手册 》 以 及 云 创 大 数据 提 
供 的 大 数据 实验 平台 ， 帮 助 到 场 老 师 们 跑 通 了 Hadoop, Spark 等 多 个 大 
数据 实验 ， 使 他 们 跨 过 了 “从 理论 到 实践 ， 从 知道 到 用 过 ”的 门槛 。 

其 中 ， 为 了 解决 大 数据 实验 难 问题 而 开发 的 大 数据 实验 平台 ， 
正在 为 越 来 越 多 的 高 校 教学 科研 带 去 方便 , 帮助 解决 缺 “ 机 器 ”与 缺 “ 原 
材料 ”的 问题 。2016 年 ， 我 带领 云 创 大 数据 的 科研 人 员 ， 应 用 Docker 
容器 技术 , 成功 开 发 了 BDRack 大 数据 实验 一 体 机 ， 它 打破 了 虚拟 化 技 


术 的 性 能 瓶颈 ， 可 以 为 每 一 位 参加 实验 的 人 员 虚 拟 出 Hadoop 集群 、 
Spark 集群 、Storm 集群 等 ， 自 带 实 验 所 需 数据 ， 并 准备 了 详细 的 实验 
手册 (包含 42 个 大 数据 实验 )、PPT 和 实验 过 程 视 频 ， 可 以 开展 大 数据 
管理 、 大 数据 挖掘 等 各 类 实验 ， 并 可 进行 精确 营销 、 信 用 分 析 等 多 种 实 
战 演练 。 

目前 ， 大 数据 实验 平台 已 经 在 郑州 大 学 、 成 都 理工 大 学 、 金 陵 科技 学 
院 、 天 津 农 学 院 、 西 京 学 院 、 郑 州 升 达 经 贸 管 理学 院 、 信 阳 师 范 学 院 、 镇 
江 高 等 职业 技术 学 校 等 多 所 院 校 部 署 应 用 ， 并 广 受 校方 好 评 。 该 平台 也 可 
以 云 服务 的 方式 在 线 提供 ， 实 验 更 是 增 至 85 个 ， 师 生 通 过 自学 ， 可 用 
一 个 月 时 间 成 为 大 数据 实验 动手 的 高 手 。 此 外 , 面 对 席 卷 而 来 的 人 工 智 
能 浪潮 , 我 们 团队 推出 的 AIRack 人 工 智 能 实验 平台 、DeepRack 深度 学 
习 一 体 机 以 及 dServer 人 工 智能 服务 器 等 系列 应 用 ， 一 举 解决 了 人 工 智 
能 实验 环境 搭建 困难 、 缺 乏 实验 指导 与 实验 数据 等 问题 ， 目 前 已 经 在 清 
华 大 学 、 南 京 大 学 、 南 京 农业 大 学 、 西 安 科技 大 学 等 高 校 投入 使 用 。 

在 大 数据 教学 中 ， 本 科 院 校 的 实践 教学 应 更 加 系统 性 ， 偏 向 新 技术 
的 应 用 ， 且 对 工程 实践 能 力 要 求 更 高 。 而 高 职 、 高 专 院 校 则 更 偏向 于 技 
术 性 和 技能 训练 ,理论 以 够 用 为 主 , 学 生 将 主要 从 事 数 据 清 洗 和 运 维 方 
面 的 工作 。 基 于 此 ， 我 们 联合 多 家 高 职 院 校 专家 准备 了 《 云 计算 导论 》 
《大 数据 导论 》《 数 据 挖掘 基础 》《R 语言 ) 《数据 清洗 》《 大 数据 系统 
运 维 》《 大 数据 实践 》 系 列 教材 ， 帮 助 解决 “机 制 ” 欠 缺 的 问题 。 

此 外 ， 我 们 也 将 继续 在 中 国 大 数据 和 中 国 云 计算 等 网 站 免费 提供 配套 
PPT 和 其 他 资料 。 同 时 ， 持 续 开 放大 数据 实验 平台 、 免 费 的 物 联网 大 数据 
托管 平台 万 物 云 和 环境 大 数据 免费 分 享 平台 环境 云 ,使 资源 与 数据 随手 可 
得 ， 让 大 数据 学 习 变 得 更 加 轻松 。 

在 此 ， 特 别 感谢 我 的 硕士 导师 谢 希 仁 教授 和 博士 导师 李 三 立 院士 。 
谢 希 仁 教授 所 著 的 《计算 机 网 络 》 已 经 更 新 到 第 7 版 , 与 时 俱 进 , 日 至 
完美 ， 时 时 提醒 学 生 要 以 这 样 的 标准 来 写 书 。 李 三 立 院士 是 留 苏 
博士 ， 为 我 国 计 算 机 事业 做 出 了 杰出 贡献 ， 曾 任国 家 攀登 计划 项 目 首席 
科学 家 。 他 的 严谨 治学 带 出 了 一 大 批 杰 出 的 学 生 。 

本 从 书 是 集体 智慧 的 结晶 ， 在 此 谨 向 付出 辛勤 劳动 的 各 位 作者 致敬 ! 
书 中 难免 会 有 不 当 之 处 ， 请 读者 不 音 赐教 。 


刘 Hh 
于 南京 大 数据 研究 院 
2018 年 5 月 
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Python 作为 胶水 语言 , 其 粘 合 力 无 与 伦比 。 尤其 是 站 在 “大 数据 +” 
与 “人 工 智能 ”的 风口 之 上 , 可 谓 是 如 鱼 得 水 , 潜力 无 限 。 就 如 同 Python 
语言 发 明 人 Guido van Rossum 曾 说 : “life is short you need Python.( 人 生 
苦 短 ， 我 用 Python。) ”当下 的 Python 语言 风靡 全 球 ， 席 卷 神 州 大 地 ! 
Python 凭借 其 得 天 独 厚 的 优良 基因 ， 使 用 户 如 雨后春笋 一 般 涌 现 出 来 。 

Python 的 盛行 是 时 代 风 口 和 其 内 在 基因 聚合 的 结果 。 这 是 因为 
Python 以 其 开源 性 、 可 扩展 性 为 根本 抓 住 了 时 代 的 主旋律 。 尤 其 是 人 工 
智能 领域 的 再 次 爆发 ， 世 界 顶 尖 公司 以 Python 为 母体 推出 优秀 的 机 器 
学 习 框 架 (如 Google 的 TensorFlow) ， 更 是 助 推 Python 成 为 风口 上 的 
王者 。 作 者 认为 用 “no Python , no code (无 Python, 不 代码 ) ”来 赞颂 
Python 也 不 为 过 。 然 而 ，Python 的 流行 过 于 突然 ， 市 场 上 大 部 分 介绍 
Python 的 书籍 都 是 外 文 著作 直接 翻译 过 来 的 , 其 写作 习惯 和 风格 不 太 适 
合 中 国 读者 的 需求 ， 同 时 国内 介绍 Python 的 书籍 也 良 劳 不 齐 。 

为 了 使 国内 读者 能 够 系统 地 了 解 新 技术 、 新 方法 ， 南 京 大 数据 研究 
院 刘 觅 教授 顺势 而 为 ， 周 密 规 划 ， 在 大 数据 应 用 人 才 培 养 课程 体系 中 ， 
专门 设立 了 Python 语言 课程 ， 并 邀请 全 国 上 百 家 高 校 中 从 事 一 线 教 学 
和 科研 的 教师 一 起 , 编撰 大 数据 应 用 人 才 培 养 系列 从 书 ， 本 书 即 该 套 从 
diat a 

本 书 以 “任务 驱动 ， 实 战 为 王 ” 为 出 发 点 ， 详 细 介绍 Python 语言 
的 基础 知识 ， 同 时 ， 书 中 剖析 了 3 个 典型 的 切 近 生活 的 实战 案例 ， 以 培 
养 读 者 解决 问题 的 能 力 。 另 外 ， 本 书 以 “理论 和 实践 两 手 抓 ， 两 手 都 要 
硬 ” 为 根本 ， 在 每 章 的 理论 学 习 之 后 ， 都 有 与 之 匹配 的 上 机 实验 和 课堂 
练习 。 将 理论 和 实践 融 为 一 体 ， 让 读者 真正 地 将 理论 和 实战 合 二 为 一 ， 
做 到 学 以 致 用 。 

本 书 重点 阐述 Python 语言 的 基础 知识 和 与 之 相关 的 3 个 典型 的 项 
目 实 战 案 例 。 全 书 共 13 36. 分 为 两 大 部 分 : 第 一 部 分 以 Python 编程 语 
言 基础 知识 普及 为 主 , 分 别 介绍 了 Python 3 概述 、 基 本 语法 、 流程 控制 、 
组 合 数 据 类 型 、 字 符 串 与 正则 式 、 函 数 、 模 块 、 类 和 对 象 、 异 常 及 文件 
操作 ; 第 二 部 分 以 项 目 实战 为 核心 ， 以 学 以 致 用 为 导向 ， 以 切 近 生活 的 
案例 为 依托 ， 分 别 介绍 Python ERM HKA., Python 数据 可 视 化 项 目 
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实战 和 Python 数据 分 析 项 目 实战 。 其 中 第 一 部 分 : 第 1 一 5 章 由 钟 涛 老 
师 编 写 ， 第 6 一 10 章 由 刘 河 和 刘 娅 老师 编写 ， 第 二 部 分 : 第 11 一 13 章 
项 目 实战 由 李 肖 俊 老师 编写 。 

本 书 的 编撰 ， 从 提纲 的 确定 到 内 容 的 把 握 与 芯 酌 ,到 最 后 的 审阅 与 
定稿 , 得 到 了 南京 大 数据 研究 院 院 长 刘 觅 教授 亲 力 亲 为 的 大 力 指导 ,并 
是 出 了 诸多 建设 性 的 意见 。 同 时 , 清华 大 学 出 版 社 的 王 莉 编辑 和 南京 云 
创 大 数据 的 武 郑 浩 编辑 也 评阅 了 本 书 书 稿 , 对 本 书 给 予 了 全 面 的 指导 和 
帮助 ， 在 此 一 并 致谢 。 

在 此 ,特别 感谢 南京 大 数据 研究 院 院 长 刘 鹏 教授 , 正 是 由 于 他 洞察 
时 代 需 求 ， 把 握 时 代 脉 捕 ， 才 有 了 《Python 语言 》 这 本 书 的 创作 需求 ， 
才 有 了 我 们 的 创作 团队 ， 才 有 了 这 本 《Python 语言 》。 

总 之 ,本 书 是 集体 智慧 的 结晶 , 在 此 说 向 付出 辛勤 劳动 的 各 位 作者 
致敬 ! 书 中 难免 会 有 不 当 之 处 ， 请 读者 不 音 赐教 。 
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Python 3 概述 


Life is short, use Python. — Guido van Rossum 


Life is short, you need Python. — — Bruce Eckel 


“人 生 苦 短 , 我 用 Python", 不仅 Python 之 父 Guido 7E 7T 29i H CZEUUX 
Project) 的 大 会 上 穿着 印 有 这 段 话 中 英文 版 本 的 工 恤 , 而 且 Java 大 师 Bruce 
Eckel 都 发 出 了 这 样 的 感慨 。 

那么 为 什么 人 生 苦 短 就 要 用 Python? 编程 语言 不 是 有 很 多 种 吗 ? 为 什 
么 不 用 汇编 、C、C++、C#、Java、Go、PHP 等 ， 而 要 用 Python WE? 

Python 是 一 种 面向 对 象 的 解释 型 高 层次 计算 机 程序 设计 语言 ， 与 其 他 
语言 相 比 ， 功 能 强大 、 通 用 性 强 、 语 法 简洁 、 可 读 性 强 且 代码 量 小 ， 学 习 
起 来 相对 简单 ， 特 别 适合 编程 的 初学 者 。 

目前 ， 从 全 球 范围 来 看 ，Python 已 经 成 为 最 受 欢迎 的 程序 设计 语言 
一 。 而 在 我 国 , 中 小 学 都 将 开设 Python 课程 , 高 考 也 将 把 Python 纳入 其 中 ， 
并 且 各 大 高 校 的 理工 科 专业 几乎 都 把 Python 列 为 专业 必修 课 ， 其 重要 性 不 
言 而 喻 。 
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, 1.1 Python 简介 


关于 Python， 首 先 得 纠正 一 下 ，Python 语言 并 不 是 一 门 新 的 编程 语言 ， 
实际 上 Python 语言 已 经 不 能 算是 baby (婴儿 ) 了 ， 它 目前 已 经 超过 27 岁 
了 , 它 早 于 HTTP 1.0 协议 5 年, 早 于 Java 语 言 4 年 如 果 你 对 长 长 的 Python 
发 展 历史 比较 好 奇 ， 那 下 面 我 们 就 来 了 解 一 下 Python 的 前 世 今 生 。 


1.1.1. Python 的 前 世 今 生 


Python 是 由 荷兰 人 Guido van Rossum ( 吉 多 。 范 。 罗 苏 姆 ) 于 1989 年 
圣诞 节 期 间 发 明 ，Python 第 一 个 公开 发 行 版 于 1991 年 发 行 。 

1989 年 的 圣诞 节 期 间 , 在 阿姆斯特丹 休假 的 吉 多 为 了 打发 无 聊 的 假期 ， 
决定 自己 开发 一 个 新 的 脚本 解释 程序 ， 并 根据 当时 他 最 喜欢 的 BBC 电视 剧 
(HE - 派 森 的 飞行 马戏 团 (Monty Python's Flying Circus)》 将 这 门 语言 
名 为 Python， 而 python 这 个 英语 单词 的 意思 是 蟒蛇 ， 因 此 Python 语言 的 图 
标 被 设计 成 两 条 大 蟒蛇 相互 纠缠 的 样子 。 

Python 语言 被 吉 多 作为 是 ABC 语言 的 一 种 继承 ， 当 时 吉 多 参加 设计 
ABC 这 种 数学 语言 ， 吉 多 本 人 认为 ，ABC 语言 是 非常 优美 和 强大 的 ， 是 专 
门 为 非 专业 程序 员 设 计 的 。 后 来 ABC 语言 并 没有 取得 成 功 ， 吉 多 认为 是 
ABC 语言 过 于 封闭 ， 没 有 进行 开放 而 造成 的 。 吉 多 决心 避免 这 一 错误 ， 在 
Python 语言 问世 时 ， 他 在 互联 网 上 公开 了 源 代 码 ， 并 获取 了 非常 好 的 效果 ， 
因为 源 代 码 的 公开 , 让 世界 上 更 多 热爱 编程 ,喜欢 Python 的 程序 员 对 Python 
不 断 地 进行 功能 完善 。 现 在 Python 是 由 一 个 核心 开发 团队 在 维护 ， 吉 多 仍 
然 占据 着 至 关 重 要 的 作用 ， 指 导 其 进展 。 

在 全 世界 程序 员 不 断 的 改进 和 完善 下 ，Python 现今 已 经 成 为 最 受 欢迎 
的 程序 设计 语言 之 一 。 自 从 2004 年 以 后 ，Python 的 使 用 率 呈 线性 增长 ， 
2018 年 2 月 调查 显示 Python 语言 在 开发 语言 中 排名 第 4， 仅 次 于 Java. C 
和 C++。 

2018 年 3 月 ， 该 语言 作者 在 邮件 列表 上 宣布 Python 2.7 将 于 2020 年 1 
H 1 日 终止 支持 用 户 如 果 想 要 在 这 个 日 期 之 后 继续 得 到 与 Python 2.7 有 关 
的 支持 ， 则 需要 付费 给 供应 商 。 也 是 因为 这 个 原因 ， 本 书 的 Python 版 本 将 
使 用 Python 3.6.5， 紧 随 技术 发 展 的 潮流 。 


1.1.2 Python 的 应 用 场合 


Python 可 以 应 用 于 众多 领域 ， 如 人 工 智 能 、 云 计算 、 大 数据 分 析 、 机 
器 学 习 、 网 络 服务 、 礁 虫 、 科 学 计算 等 众多 领域 。 目 前 互联 网 行业 几乎 所 
有 大 中 型 企业 都 在 使 用 Python， 如 国内 的 阿里 巴巴 、 百 度 和 腾讯 等 ， 国 外 
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的 Amazon、Google、Facebook 和 YouTube 等 。 
Python 目前 的 主要 应 用 领域 如 下 所 示 。 
O 人 工 智 能 : TAAIE AlphaGo (BIKEA E. 
O Kiti: OpenStack 开源 云 平台 。 

O 大 数据 : 数据 可 视 化 、 数 据 分 析 、 大 数据 挖掘 。 

E) 

u 


Fjf&& ri: selenium. scrapy. requests ^5. 
系统 运 维 : 自动 化 运 维 。 
Python 在 一 些 公司 的 应 用 如 下 所 示 。 
谷歌 : Google earth, Google 广告 等 项 目 都 在 大 量 使 用 Python 开发 。 
口 CIA: 美国 中 情 局 网 站 是 用 Python 开发 的 。 
口 NASA: 美国 航天 局 (NASA) 大 量 使 用 Python 进行 数据 分 析 和 
运算 。 
口 YouTube: 世界 上 最 大 的 视频 网 站 YouTube 是 用 Python 开发 的 。 
O Facebook: 大 量 的 基础 库 均 是 通过 Python 实现 的 。 
O Redhat: 世界 上 最 流行 的 Linux 发 行 版 本 中 的 yum 包 管 理工 具 就 
是 用 Python 开发 的 。 
高 德 地 图 : 高 德 地 图 服务 端 部 分 是 使 用 Python 开发 的 。 
腾讯 : 腾讯 游戏 运 维 平台 一 一 无 人 值守 引擎 ， 大 量 使 用 Python。 
豆 关 :该 公司 几乎 所 有 的 业务 均 是 通过 Python 开发 的 。 
知 乎 ;国内 最 大 的 问答 社区 是 使 用 Python 开发 的 。 
除 此 之 外 ， 还 有 搜狐 、 人 金山、 盛大、 网易、 百度、 阿里 、 淘 宝 、 土 豆 、 
新 浪 、 果 过 等 公司 都 在 使 用 Python 完成 各 种 各 样 的 任务 。 


1.1.8. Python 的 特性 


D 


Python 是 一 门 易 读 、 易 维护 的 语言 ， 被 广大 编程 人 员 所 喜欢 。 它 的 适 
用 性 强 ， 用 途 广泛 ， 无 论 是 初学 者 还 是 具备 一 定编 程 经 验 的 程序 员 ， 都 可 
以 快速 上 手 使 用 。 

在 开始 使 用 Python 编写 代码 之 前 , 我 们 来 了 解 一 下 Python 具有 的 一 些 
特性 ， 对 今后 的 学 习 不 无 神 益 。 

Python 简单 易学 。Python 是 一 门 容易 上 手 的 编程 语言 ， 因 为 吉 多 的 设 
计 哲 学 就 是 要 让 Python 程序 具有 良好 的 可 阅读 性 ， 就 像 是 在 读 英语 一 样 ， 
尽量 让 开发 者 能 够 专注 于 解决 问题 而 不 是 去 搞 明 白 语言 本 身 。 

Python 是 面向 对 象 的 高 层 语言 。Python 同时 支持 面向 过 程 的 编程 和 面 
向 对 象 的 编程 ， 只 是 程序 内 容 有 不 同 。 在 使 用 Python 语言 编写 程序 时 ， 无 
须 考 虑 C 语言 等 需要 考虑 的 内 存 回收 等 一 类 的 底层 细节 问题 。 
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Python 语言 是 免费 且 开 源 的 ， 是 FLOSS 〈 自 由 /开放 源码 软件 ) 之 一 。 
免费 并 开源 的 Python 让 使 用 者 毫 无 限制 地 阅读 它 的 源 代码 、 对 软件 源 代 码 
进行 更 改 或 者 应 用 到 新 的 开源 软件 中 ， 让 它 得 到 更 好 的 维护 和 发 展 。 

Python 是 解释 性 语言 。Python 语言 编写 的 程序 不 需要 编译 成 二 进 制 代 
码 ， 是 通过 解释 器 直接 解释 源 代 码 来 运行 。 

Python 程序 编写 需 使 用 规范 的 代码 风格 。 吉 多 设计 Python 时 采用 强制 
缩 进 的 方式 ， 让 代码 的 可 读 性 更 高 。 另 外 ，PEP8 代码 编写 规范 也 是 Python 
的 开发 者 非常 乐于 遵从 的 标准 之 一 。 

Python 是 可 扩展 和 可 嵌入 的 。 在 Python 程序 想 要 一 段 关 键 代 码 运行 加 
快 或 者 某 些 算法 不 便 公 开 时 ， 可 以 选择 使 用 C 或 C++ 来 编写 关键 部 分 ， 编 
译 成 二 进 制 的 库 ， 然 后 将 其 在 Python 程序 中 调用 即 可 。 

Python 是 可 移植 的 。 由 于 它 是 开源 且 是 解释 性 语言 ，Python 已 经 可 以 
移植 到 大 多 数 平台 并 流畅 运行 , 这 些 平台 包括 我 们 常见 的 Linux, Windows. 
Mac 和 移动 客户 端的 Android 平台 等 。 

Python 运行 速度 快 。Python 程序 运行 速度 比 Java 程序 快 ， 因 为 Python 
的 底层 是 用 C 语言 编写 的 , 很 多 标准 库 和 第 三 方 库 也 都 是 用 C 编写 的 。 当 
然 ， 如 果 还 想 加 快速 度 ， 可 以 使 用 C 来 编写 程序 的 关键 部 分 。 

Python 提供 了 丰富 的 库 。Python 的 标准 库 很 庞大 ， 可 以 用 来 帮助 我 们 
处 理 各 种 工作 ， 包 括 正则 表达 式 、 单 元 测试 、 线 程 、 数 据 库 、 网 页 浏览 器 
和 其 他 与 系统 有 关 的 操作 。 除 了 标准 库 以 外 ， 还 有 许多 其 他 高 质量 的 库 来 
提供 支持 ， 如 wxPython、Twisted 和 Python 图 像 库 等 。 


1.1.4. 选择 Python 的 版 本 


由 于 Python 是 在 1991 年 2 月 开源 发 布 , 早 于 第 一 版 Unicode 标准 (在 
1991 年 10 月 发 布 )， 在 其 后 的 几 年 中 ， 陆 续 出 现 的 各 种 编程 语言 几乎 都 支 
持 Unicode 编码 ， 而 Python 2 不 支持 ， 这 让 Python 2 处 于 乾 雁 的 境地 ， 
虽然 之 后 对 Python 2 进行 了 一 定 程度 的 更 新 ， 但 收效 不 大 。 

为 了 解决 类 似 问 题 ，2008 年 10 月 Python 3.0 版 本 发 布 ， 该 版 本 在 
Python 2 的 基础 上 进行 了 很 大 的 改变 ， 使 得 两 者 互 不 兼容 。 现 存 的 大 量 
Python 2 的 代码 需要 经 过 修改 才能 在 Python 3 上 运行 ， 这 个 工作 量 也 非常 
巨大 ， 于 是 大 多 数 Python 2 的 应 用 选择 了 维持 现状 ， 因 此 ， 目 前 是 一 个 
Python 2 fil Python 3 共存 的 时 代 。 

我 们 该 如 何 选择 Python 的 版 本 呢 ? 由 于 Python 3 相 较 于 Python 2 还 有 
大 量 的 改进 和 提升 的 地 方 ， 这 就 使 得 Python 2 有 了 些许 “鸡肋 ”之 感 。 因 
此 , 我 们 跟随 技术 的 发 展 和 前 进 的 潮流 , 选择 Python 3 作为 我 们 学 习 的 对 象 。 
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1.1.5 ”如何 学 习 Python 


概括 地 讲 ， 学 习 Python 需要 学 习 它 的 基本 语法 ， 和 由 一 系列 的 库 提供 
的 其 他 扩展 方法 , 最 常见 的 库 有 Numpy、 pandas, matplotlib、 Iphython、 SciPy 
等 。 对 于 刚 入 门 的 新 手 们 ， 应 该 怎样 学 习 呢 ? 

(1) 打 好 基础 : 计算 机 编程 是 需要 经 过 长 期 练习 才能 提升 水 平 的 ， 学 
习 编 程 的 最 好 方法 是 先 学 习 、 后 模仿 、 再 自主 创新 。 就 像 学 习 其 他 编程 语 
言 或 者 学 习 一 门 外 语 一 样 ,我 们 应 该 从 Python 的 基础 开始 学 习 , 了 解 Python 
的 数据 类 型 、 变 量 、 判 断 、 循 环 、 函 数 、 类 等 ， 逐 步 找到 编程 的 感觉 ， 进 
而 体会 并 领悟 其 中 的 思想 。 

(2) 积极 实践 : 俗话 说 “ 拳 不 离 手 ， 曲 不 离 口 ” 程序 编写 水 平 是 在 不 
断 地 练习 和 实践 中 提高 的 。 

CD 遵守 规范 : 编写 Python 程序 ， 特 别 要 注意 代码 风格 的 统一 和 规范 
化 。 现 在 的 软件 项 目 开 发 ， 几 乎 都 是 团队 协作 完成 ， 每 一 位 开发 者 编写 的 
代码 要 让 相关 人 员 看 得 懂 ， 才 能 更 好 地 配合 工作 ， 例 如 代码 走 查 〈code 
walkthrough)、 代 码 评 审 (code review 和 白 盒 测试 (white box testing) 等 。 
规范 的 代码 编写 风格 ， 显 示 了 开发 者 良好 的 编程 素质 和 团队 精神 。 我 们 建 
议 使 用 Python 编程 的 开发 者 都 应 遵循 PEP8 规范 ， 因 此 我 们 将 在 第 2 章 对 
该 规范 进行 讲解 。 

(4) 自主 学 习 : 也 许 你 为 了 完成 某 些 特定 功能 ， 需 要 使 用 一 些 还 未 了 
解 的 技术 ， 那 就 不 要 犹 驳 和 等 待 ， 自 己 主动 去 研究 和 学 习 吧 ! 

(5) 善于 交流 : 加 入 Python 学 习 群 、 兴 趣 小 组 等 ， 积 极 主动 地 和 其 他 
学 习 者 交流 ， 将 自己 遇 到 的 问题 摆 出 来 ， 获 得 他 人 指导 ， 并 学 习 对 方 的 经 
验 ， 或 者 利用 自己 所 学 为 别人 解决 问题 ， 这 样 取 长 补 短 ， 互 通 有 无 ， 进 步 
会 非常 明显 而 迅速 。 


1.2 Python 环境 构建 


说 完 如 何 学 习 ， 我 们 就 开始 动手 实践 。Python 的 开发 和 运行 环境 是 学 
习 Python 的 基本 工具 ， 那 么 我 们 先 来 安装 Python 3， 并 配置 开发 环境 。 本 
部 分 以 本 书 成 稿 时 的 稳定 版 Python 3.6.5 为 例 , 介绍 Python 3 在 各 主流 操作 
系统 上 的 安装 过 程 ， 如 需 安装 更 高 版 本 ， 本 节 可 供 参考 。 


1.2.1 在 Windows 系统 中 安装 Python 3 


进入 Python 官方 网 站 (https://www.Python.org) 下 载 安装 包 ,， 单 击 导 航 
栏 的 Downloads 选择 Windows 系统 ， 进 入 Windows 版 的 下 载 页 面 (https:// 
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www.Python.org/downloads/windows/), 会 看 到 适用 于 Windows 的 多 个 版 本 ， 
每 个 版 本 又 有 多 个 下 载 选项 ， 这 里 对 选项 进行 说 明 。 
D) web-based installer: 基于 Web 的 安装 文件 ， 安 装 过 程 中 需要 一 直 


连接 网 络 。 

O executable installer: 是 可 执行 的 安装 文件 ， 下 载 后 直接 双击 开始 
安装 。 

O embeddable zip file: 是 安装 文件 的 zip 格式 压缩 包 ， 下载 后 需要 解 
压缩 之 后 再 进行 安装 。 


Q Windows x86-64 executable installer: x86 架构 的 计算 机 的 Windows 
64 位 操作 系统 的 可 执行 安装 文件 。 
下 载 页 面 如 图 1.1 所 示 。 


© @ Python Software Foundation (US) | https//www.python.org/downloads/windows/ 
® Download Windows x86-64 executable installer 
® Download Windows x86-64 embeddable zip file 
® Download Windows help file 
© Python 3.6.5 - 2018-03-28 

a Download Windows x86 web-based installer 

* Download Windows x86 executable installer 

® Download Windows x86 embeddable zip file 

® Download Windows x86-64 web-based installer 
'* Download Windows x86-64 executable installer 
® Download Windows x86-64 embeddable zip fite 


11 下 载 页 面 

这 里 下 载 的 是 Windows x86 executable installer， 下 载 完成 后 ， 双 击 该 文 
件 ， 进 行 安装 。 

安装 时 ， 请 根据 Windows 系统 的 实际 情况 进行 选择 或 配置 。 为 了 更 好 
地 熟悉 Python 3 的 环境 ， 这 里 选择 自 定义 安装 。 

如 图 1.2 所 示 ， 安 装 时 需要 选中 最 下 方 的 Add Python 3.6 to PATH 复 选 
HE, HIE Python 3.6 的 可 执行 文件 、 库 文件 等 路 径 添 加 到 环境 变量 ， 这 样 可 
以 在 Windows shell 环境 下 面 运行 Python。 然 后 选择 Customize installation 
〈 自 定义 安装 )， 进 入 下 一 步 。 


alois 
j Install Python 3.6.5 (32-bit) 
Com o erae or eiie etes. 
e Es aatratorvpppatavlocalvproeraaavpythoa 
armen 


documentation 
tes shortcuts and file associations 


3 Custosize installation 
Choose location and features 


python 
windows F Asa Pynon 36 to Pam Carei 


12 开始 安装 
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在 Optional Features 可 选 功能 选择 时 ， 如 果 没 有 其 他 的 特殊 需求 ， 就 全 
选 上 ， 这 些 功 能 如 下 所 示 。 
DL) Documentation: 安装 Python 文档 文件 。 
pip: 下 载 和 安装 Python 包 的 工具 。 
td/tk and IDLE: 安装 tkinter 和 IDLE 开发 环境 。 
Python test suite: Python 标准 库 测 试 套件 。 
py launcher: Python 启动 器 。 
for all users (requires elevation): 所 有 用 户 使 用 。 
单 击 Next 按钮 进行 下 一 步 ， 如 图 1.3 所 示 。 


DOODO 


Optional Features 
M 


Documentation 


Fm 
E. Pyron imt mae 
em 
puthon 
windows Ea [me] rev] 


13 ”可 选 功能 选择 
进入 高 级 选项 时 ， 选 中 Install for all users 复 选 框 针对 所 有 用 户 安装 ， 
就 可 以 按 自己 的 需求 修改 安装 路 径 ， 如 图 1.4 所 示 ， 这 里 将 安装 路 径 修改 
到 了 D:\Program FilesPython36 下 ， 单 击 Install 按钮 开始 安装 ， 安 装 进度 如 


图 1.5 所 示 。 


siol 
j Advanced Options 
FE test tor at users 


[F Assocte ties weh Python (eques the py launcher) 


FF. Create shorts tor estate appicatons 
FF. Asa Python toerveorvent vraies 
FF Precomple standard trary 
[7 Dowrioad debugging symbos 


[7 Downicad debug binaries requires VS 2015 or tater) 


Castore esta location 


python i c 
windows Ta ma j] 
图 1.4 高 级 选项 


ENSE 
j] Setup Progress 
€ 
Pyton SS Core rrr 02:50 
gummi 


puthon 
windows pcm] 
图 1.5 安装 进行 中 
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安装 完成 ， 如 图 1.6 所 示 。 


zlzix| 
Setup was successful 


Special thanks to Mark Hammond. without whose years of 
freely shared Windows expertise. Python for Windows would 


stil be Python for DOS. 
New to Python? Start with the onlin i and 
documentation. 


python 
windows cw | 
图 1.6 安装 完成 
然后 使 用 命令 提示 符 进行 验证 ， 打 开 Windows 的 命令 行 模式 ， 输 入 
Python 或 python, 屏幕 输出 如 图 1.7 所 示 ， 则 说 明 Python 解释 器 成 功 运 行 ， 
Python 安装 完成 ， 并 且 相 关 环 境 变 量 配置 成 功 。 


900 32 bit (Intel)] on vin32 


07:46) [MSC 
'or more information 


17 验证 安装 
1.2.2 在 Linux 系统 中 安装 Python 3 


Linux 系统 中 自 带 安装 有 Python 2.7， 我 们 建议 不 要 去 改动 它 ， 因 为 系 
统 中 有 依赖 该 版 本 Python 的 程序 。 本 小 节 使 用 CentOS 7.2 进行 安装 示例 ， 
其 他 发 行 版 的 安装 方法 请 参见 Python 官网 的 说 明 。 

由 于 安装 时 会 使 用 gce 对 Python 3 进行 编译 ， 这 里 需要 先 安 装 gce, 在 
命令 行 中 输入 如 下 命令 进行 安装 : 

[root@python Desktop]& yum install gcc -y 

再 使 用 wget 命令 到 Python 官网 下 载 3.6.5 的 源码 安装 包 ， 命 令 如 下 : 


[root@python Desktop]# wget 
https://www.python.org/ftp/python/3.6.5/Python-3.6.5.tar.xz 


下 载 完成 后 使 用 tar 命令 对 压缩 包 解 压 ， 命 令 如 下 : 

[root@python Desktop]# tar -xzvf Python-3.6.5.tar.xz 

会 在 当前 目录 下 生成 目录 python-3.6.5， 使 用 cd 命令 切换 到 该 目录 下 ， 
编译 安装 ， 命 令 如 下 : 


[root@python Desktop]# cd python-3.6.5 
[root@python python-3.6.5]# ./configure 
[root@python python-3.6.5]£ make && make install 
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编译 安装 完成 后 , 在 命令 行使 用 Python 3 命令 运行 Python 3 的 解释 器 ， 
验证 安装 ， 如 图 1.8 所 示 。 


[root@python /]# python3 
Python 3.6.5 (default, May 23 2018, 21:48:41) 
[GCC 4.8 23 (Red Hat 4.8 1 
Type heip , "copyright", "credits" or "License" for more information. 


1.8 验证 安装 
1.2.3 在 Mac OS 系统 中 安装 Python 3 


Mac 自 带 的 是 Python 2.X 版 本 ， 如 果 需 要 Python 3X， 则 需要 自己 手动 进 
行 安装 ， 可 以 使 用 Python -V 在 终端 查看 自己 的 Python 版 本 ， 如 图 1.9 所 示 。 


heideMac:~ apple2$ python -V 
Python 2.7.10 
heideMac:^ apple2$ 


1.9 查看 Python 版 本 
W mW Python 官 X 的 下载 页 面 
Chttps://www.python.org/downloads/mac-osx/) T 2 Mac 版 本 的 Python 3.6.5, 
如 图 1.10 所 示 。 


© &à Python Software Foundation (US) | https://www 


© UOWIIIOZU MaCUS oF-DIV 32-DIt WiStatter 


nloads/mac-osx/ 


a Python 3.6.5 - 2018-03-28 
æ Download macOS 64-bit installer 


* Download macOS 64-bit/32-bit installer 
图 1.10 下 载 
下 载 完成 后 ， 双 击 安装 文件 ， 一 直 单 击 继续 进行 安装 ， 安 装 过 程 较 简 
单 ， 安 装 完成 后 ， 在 Launchpad 中 会 多 出 两 个 APP， 如 图 1.11 所 示 。 


图 1.11 新 添加 的 APP 图 标 
单 击 IDLE 进入 Python 解释 器 的 Shell， 验 证 安装 ， 如 图 1.12 所 示 。 


Python 3.6.5 (v3.6.5:f59c0932b4, Mar 28 2018, 03:03:55) 

[GCC 4.2.1 (Apple Inc. build 5666) (dot 3)] on darwin 

Type "copyright", "credits" or "license()" for more information. 

>>> WARNING: The version of Tcl/Tk (8.5.9) in use may be unstable. 

Visit http://www.python.org/download/mac/tcltk/ for current information. 


1.12 ”验证 安装 
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13 ”第 一 个 程序 Hello World! 


Python 3.6.5 安装 完成 后 , 其 自 有 的 集成 开发 和 学 习 环 境 IDLECPython's 
Integrated Development and Learning Environment) 也 一 并 安装 了 ,如 非特 别 
说 明 ， 本 书 的 代码 均 以 IDLE 作为 开发 环境 ， 后 续 章 节 中 安装 、 配 置 和 使 用 
其 他 集成 开发 环境 ， 仅 作为 示例 ， 以 供 参考 。 

这 里 ， 将 编写 并 执行 我 们 的 第 一 个 Python 程序 Hello World!。 在 Windows 
中 ， 我 们 介绍 3 种 方法 调用 Python 解释 器 来 编写 和 执行 Python 程序 。 

第 一 种 方法 ， 在 命令 行 模式 下 ， 进 入 Python 解释 器 进行 代码 编写 ， 该 
方法 可 以 简单 快速 地 开始 我 们 的 编程 。 

在 Windows (Windows 7 或 10) 操作 系统 中 ， 使 用 快捷 键 wintR, 9f 
出 “运行 ”窗口 ， 输 入 cmd 并 确定 ， 输 入 Python 进入 Python 命令 行 ， 在 
提示 符 >>> 之 后 , 可 以 输入 程序 代码 。 这 里 输入 第 一 个 Python 程序 的 代码 : 

>>> print("Hello World!") 


完成 输入 后 按 Enter 键 执行 ， 执 行 结 果 显 示 在 该 代码 下 一 行 ， 如 图 1.13 
所 示 。 


#59c0932b4, Mar 28 2018, 16:07:46) [NSC v.1900 32 bit (Intel)] on win32 
ght”, "credite" or " ^ 'ormation. 
) 


1.13 输出 Hello World! 


第 二 种 方法 , 单 击 Windows 的 “开始 ”菜单 , 从 程序 组 中 找到 Python 3.6 
下 的 IDLE (Python 3.6 32-bib 快捷 方式 ， 如 图 1.14 所 示 。 


JL Python 3.6 
À IDLE (Python 3.6 32-bit) 
EP Python 3.6 (32-bit) 
i$ Python 3.6 Manuals (32-bit) 
À Python 3.6 Module Docs (32-bit 


图 1.14 启动 IDLE Shell 
单 击 并 进入 Python IDLE Shell 窗口 ， 在 提示 符 >>> 之 后 ， 输 入 第 一 个 
Python 程序 的 代码 : 
>>> print("Hello World!") 


完成 输入 后 按 Enter 键 执 行 ， 如 图 1.15 所 示 。 


zloj xi 
Options Window Help 
5:f59c0932b4, Mar 28 2018, 16:07:46) [MSC v. 1900 32 bit (Inte 加 


ts” or "license" for more information. 


图 1.15 IDLE Shell 输出 Hello World! 
第 三 种 方法 ， 参 照 第 二 种 方法 打开 IDLE 时 ， 系 统 默认 打开 的 是 IDLE 
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Shell 窗口 ,修改 IDLE 启动 时 的 默认 设置 , 使 其 直接 打开 IDLE 的 编辑 器 窗 
(Editor Window): 选择 菜单 中 的 Options, Configure IDLE, 打开 Settings 
对 话 框 ， 选 择 General 选项 不， 在 Window Preferences 选项 组 的 At Startup 
单 选 按 钮 组 中 选中 Open Edit Window 单 选 按 钮 ， 单 击 OK 按钮 确认 ， 如 
图 1.16 和 图 1.17 所 示 。 


m —-— lal xl 
File Edit Shell Debug|Options Window Help 
Python 3.6.5 (v3.6.5:ff Configure IDLE pole, 16:07:46) [MSC v.1900 32 bit (Inte 到 
1)] on win32 Code Context 
Tene “rrneriohtf” "are ” far mara information 
1.16 IDLE Shell 窗口 Options 菜单 
CE > 


Fonts/Tabs |Highlights| Keys General |Extensions| 
Window Preferences 


[s Startup C Open Edit Window) C Open Shell Window | 
1.17 Settings 对 话 框 
关闭 Shell 窗口 后 ， 再 次 启动 IDLE， 此 时 可 直接 进入 编辑 器 窗口 ， 将 
代码 复制 到 该 窗口 ， 按 Cubes 快捷 键 ， 将 其 保存 为 HelloWorldpy， 选 择 菜 
单 中 的 Run 一 Run Module 命令 , IDLE 的 Shell 窗口 被 弹出 并 显示 执行 结果 ， 
如 图 1.18 所 示 。 


urcecode\Hellotorld. py (3.6.5) =loj xj 
Window Help 

到 

=|D|x| 


File Edit Shell Debug Options Window Help " ' 
Python 3.6.5 (v3.6.5:f59:0932bd, Mar 28 2018, 16:07:46) [MSC v.1900 32 bit (Inte 加 | 
1)] on win32 

Type "copyright", "credits" or "license ()" for more information. 

3» 


RESTART: D:VPython sourcecodeWlelloWorld.py ================ 


图 1.18. HelloWorld.py 执行 结果 
至 此 ， 我 们 的 第 一 个 Python 程序 就 编写 完成 并 成 功 执行 了 ， 我 们 可 以 
选择 自己 喜欢 的 方法 进行 Python 语言 的 学 习 和 开发 。 
1.3.1 程序 简 析 


这 里 ， 我 们 对 这 个 简单 的 入 门 程序 做 个 粗略 的 分 析 。 
O print): Python 内 置 函数 名 称 ， 作 用 是 输出 括号 中 的 内 容 。 
口 "Hello World": 字符 串 类 型 的 数据 ， 作 为 参数 传递 给 print 函数 。 


1.3.2 print() 函 数 


通过 编写 Hello World! 程序 ， 我 们 简单 了 解 了 Python 语言 ， 这 里 再 对 
printO 函 数 做 进一步 说 明 ， 它 的 基本 用 法 如 下 : 
print( 参数 ) 
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printO 是 函数 ， 参 数 就 是 需要 输出 的 内 容 ， 这 些 内 容 可 以 是 数值 、 字 符 
串 、 布 尔 、 列 表 或 字典 等 数据 类 型 ， 也 可 以 输出 另 一 函数 输出 的 值 ， 当 然 
也 可 以 没有 参数 ， 输 出 一 个 空 行 ， 如 果 要 输出 多 个 参数 ， 参 数 与 参数 之 间 
MESE, w: 

print("China", countries) 

双 引 号 〈 或 者 使 用 单 引号 ) 内 的 内 容 称 为 字符 串 常 量 ， 照 原样 输出 内 
容 ; 没有 引号 的 countries 是 变量 , 会 输出 代表 内 容 ; printO 函 数 执行 完成 后 
默认 换行 ， 如 不 需要 换行 ， 则 在 输出 内 容 之 后 加 上 end ='"， 如 : 

print(i,end-") 


1.3.3 input() 函 数 


input(O) 函 数 是 Python 语言 中 值 的 最 基本 输入 方法 ， 通 过 用 户 输入 ， 接 
收 一 个 标准 输入 数据 ， 默 认为 string 类 型 ， 基 本 用 法 如 下 : 

object = input(' 提 示 信 息 ') 

object 是 需要 接收 用 户 输入 的 对 象 , 提示 信息 的 内 容 在 函数 执行 时 会 显 
示 在 屏幕 上 ， 用 于 提示 用 户 输入 。 提 示 信 息 可 以 为 空 ， 即 括号 内 无 内 容 ， 
函数 执行 时 不 会 提示 信息 。 

Input() 函 数 的 数据 输入 时 默认 为 字符 串 类 型 , 可 以 使 用 数据 类 型 转换 函 


数 进行 转换 ， 如 : 
>>> age = input(" 请 输入 年 龄 :") # 定 义 变量 
请 输入 年 龄 :18 # 执 行 ， 输 入 数值 
>>> print(type(age)) # 查 看 变量 类 型 
«class 'str> # 返 回 结果 
>>> age = int(input(" 请 输入 年 龄 :")) # 重 置 变 量 ， 谱 套 整 型 转换 
请 输入 年 龄 :18 # 执 行 ， 输 入 数值 
>>> print(type(age)) # 查 看 变量 类 型 
<class 'int> # 返 回 结果 
1.8.4 注释 


在 Python 代码 中 加 入 必要 的 注释 ， 使 其 具有 较 好 的 可 读 性 。 
注释 分 两 种 ， 单 行 注释 和 多 行 注释 。 

CD 单行 注释 : 使 用 #， 其 后 (右边 的 内 容 将 不 会 被 执行 ， 例 如 : 
# 单行 注释 的 内 容 


单行 注释 一 般 可 放 在 一 行程 序 代码 之 后 ， 或 者 独自 成 行 。 


e 一 第 1 章 Python 3 概述 


(2) 多 行 注释 : 使 用 两 组 ， 每 组 3 个 连续 的 双 引 号 或 者 单 引号 )， 两 
组 引号 之 间 为 多 行 注释 的 内 容 ， 例 如 : 


多 行 注释 的 内 容 


多 行 注释 的 内 容 


一 个 标准 的 完整 的 Python 程序 文件 的 头 部 ， 应 有 相关 注释 来 记录 编写 
者 姓名 、 实 现 的 功能 和 编写 日 期 (修改 日 期 ) 等 重要 信息 。 


1.3.5 IDLE 使 用 简介 


为 了 更 好 地 使 用 IDLE 进行 Python 程序 编写 ,这 里 介绍 一 下 IDLE 的 使 
用 方法 。 

IDLE 作为 Python 的 默认 开发 和 学 习 工 具 ， 具 有 以 下 特点 。 

(D DLE 是 一 个 百 分 百 的 纯 Python 编写 的 应 用 程序 ， 使 用 了 tkinter 
的 用 户 界面 工具 集 Ctkinker GUI toolkit). 

(2) 跨 平台 ， 在 Windows. UNIX 和 Mac OS X 上 具有 相同 的 效果 。 

(3) 交互 式 的 解释 器 ， 对 代码 的 输入 、 运 行 结果 的 输出 和 错误 信息 均 
有 友好 的 颜色 提示 ， 并 且 用 户 可 自 定 义 显 示 的 颜色 方案 。 

(4) 支持 多 窗口 的 代码 编辑 器 ， 也 支持 多 重 撤销 、Python 语法 颜色 区 
分 、 智 能 缩 进 、 调 用 提示 和 自动 补 全 等 。 

C5) 任意 窗口 内 的 搜索 、 编 辑 器 窗口 中 的 替换 ， 以 及 多 文件 中 的 查找 。 

(6) 具有 断 点 、 步 进 及 全 局 和 本 地 命名 空间 的 调试 器 。 

DLE 有 两 个 类 型 的 窗口 ， 一 个 是 编辑 器 窗口 (Editor window), 5j— 
个 是 Shell 窗口 (Shell window)， 编 辑 器 窗口 可 对 Python 的 源 文件 进行 打 
开 、 编 辑 和 保存 等 操作 ，Shell 窗口 则 显示 的 是 编辑 器 窗口 .py 文件 运行 后 的 
输出 信息 ， 如 图 1.19 和 图 1.20 所 示 。 


BHellororld. py - D:/Python_sourcecode/Hellotorid OO) -loj xj 
File Edit Format Run Options Window Help 
print ("Hello World!^) 到 


图 1.19 IDLE 编辑 器 窗口 


= RESTART: D:/Python_sourcecode/HelloWorld. py 


Æ 1.20 IDLE Shell 窗口 
可 同时 打开 多 个 编辑 器 窗口 ， 便 于 多 个 文件 的 编辑 和 运行 调试 ， 如 图 
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1.21 所 示 。 


图 1.21 多 个 编辑 器 窗口 
它们 的 运行 输出 信息 都 显示 在 Shell 窗口 中 ， 如 图 1.22 所 示 。 


File Edit Shell Debug Options Window Help 


=== RESTART: D:WPython sourcecodeMhe First Editor Window. py ==: 
st Editor Window! 


== RESTART: D:\Python_sourcecode\the Second Editor Window. py ==: 
ond Editor Window! 


=== RESTART: D:\Python_sourcecode\the Third Editor Window. py = 
The Third Editor Window! 


122 ”多 个 编辑 器 窗口 的 输出 

Shell 窗口 除了 可 用 于 显示 编辑 器 窗口 的 输出 外 ， 还 可 用 于 编写 单行 的 
Python 语句 ， 回 车 后 运行 并 显示 输出 结果 ， 例 如 本 节 开 始 处 的 示例 Hello 
World! . 

编辑 器 窗口 和 Shell 窗口 的 菜单 项 ， 根 据 自身 所 具有 的 功能 ， 有 些许 不 
同 ， 如 图 1.19 和 图 1.20 所 示 。 下 面 对 一 级 和 二 级 菜单 做 一 下 简要 说 明 〈 如 
非特 别 标注 ， 该 菜单 项 二 者 都 有 )。 

(D File: 文件 如 图 1.23 所 示 《〈 图 中 左边 一 列 是 菜单 项 名 称 ， 右 边 一 列 
是 该 项 的 快捷 键 ， 之 后 的 菜单 项 截图 与 此 相同 )。 


O ”New File: 打开 一 个 新 的 编辑 器 窗口 。 = — 一 一 一 (a 
O Open..: 打开 一 个 已 存在 的 文件 。 ee 
口 、Recent Files: 最 近 打 开 的 文件 。 Bw a , 
Q Open Modul... 打开 已 存在 的 模块 。 Path Brovser 
Q Module Browser: 在 当前 编辑 器 窗口 中 ， s,s CS 
以 树 形 结构 显示 函数 、 类 和 方法 。 | 
O Path Browser: 以 树 形 结构 显示 sys.path M 2 
的 目录 、 模 块 、 函 数 、 类 和 方法 。 LS CES 
O Save. 保存 当前 窗口 的 内 容 。 图 1.23 File (文件 ) 菜单 
口 Save As...: 将 当前 窗口 的 内 容 另 存 为 文件 。 
O ”Save Copy As...: 将 当前 窗口 的 内 容 保存 为 一 个 副本 。 
O Print Window: 打印 当前 窗口 的 内 容 。 
O Close: 关闭 当前 窗口 。 
ü Exit: 关闭 所 有 窗口 并 退出 IDLE. 
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(2) Edit; 编辑 如 图 1.24 所 示 。 
O Undo: 撤销 上 一 步 操 作 。 Edit Format Run Options Window Help 


Undo Ctrl+Z 


O Redo: 重复 上 一 步 操作 S Redo Ctrl+Shift+Z 
Cut Ctrl 
u Os Me. > 
: ll. Select A1 Ctrlth 
a Copy: 复制 Find... Ctrl+F 
O Paste: 粘贴 。 Find atisi ceur 
O SelectAll: 全 选 。 Vus EN ar 
" Go to Line. Alt*G 
u Pind. sub 查找 。 . Ee ud na 
LU Find Again: 重复 上 一 次 的 查找 。 Show call Tip Ctrl+backslash 
Show Surrounding Parens Ctrl+0 
O FindSelection: 查找 选 定 的 内 容 。 1.24 Edit (编辑 ) 菜单 
O FindinFiles..: 在 文件 中 查找 。 
OQ Replace..: 蔡 换 。 
O GotoLine: 跳 转 到 指定 行 。 
口 Show Completions: 显示 自动 补 全 列表 。 
口 Expand Word: 根据 用 户 输入 的 前 级 自动 补 全 匹配 的 词 。 
口 Show Call Tip: 显示 调用 方法 的 格式 。 
Q Show Surrounding Parens: 高 亮 显示 匹配 的 圆 括号 。 
(3) Format: 格式 〈 仅 编辑 器 窗口 )， 如 图 1.25 所 示 。 
Format Run Options Windo Help 
Indent Region Ctrl+] 
Dedent Region Ctrl+[ 
Comment Out Region Alt+3 
Unconnent Region Alt+4 
Tabify Region Alt+5 
Untabify Region Alt+6 
Toggle Tabs Alt+T 
New Indent Vidth Alt+U 
Fornat Paragraph Alt+Q 
Strip Trailing Whitespace 
图 1.25 Format (格式 ) 菜单 
口 Indent Region: 增加 缩 进 〈 默 认为 4 个 空格 ) 。 
口 DedentRegion: 减少 缩 进 〈 默 认为 4 个 空格 ) 。 
口 Comment Out Region: 添加 注释 〈 插 入 两 个 井 号 : 8. 
D Uncomment Region: 取消 注释 。 
ü Tabify Region: 将 前 置 的 空格 转换 为 tab。 
O Untabify Region: 将 所 有 tab 转换 为 对 应 数量 的 空格 。 
LU Toggle Tabs: 转换 用 于 缩 进 的 空格 和 tab。 
O New Indent Width: 定义 缩 进 宽度 。 
O Format Paragraph: 格式 化 段落 , 将 每 行 字符 数 限制 为 默认 值 72 个 。 
O Strip Trailing Whitespace: 移 除 单行 末尾 的 多 余 空 格 字符 。 
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(4) Run: 运行 〈 仅 编辑 器 窗口 )， 如 图 126 所 示 。 
Run Options Window H 


Python Shell 
Check Module Alt*X 
Run Module F5 


图 1.26 Run (运行 ) 菜单 


O Python Shell: 打开 Shell 窗口 。 

Check Module: 对 当前 窗口 内 容 进 行 语法 检查 。 

Run Module: 进行 语法 检查 ， 并 运行 当前 窗口 内 容 。 
Shell: Shell ( 仅 Shell 窗口 )， 如 图 1.27 所 示 。 


Shell Debug Options Window H 
View Last Restart — F6 
Restart Shell Ctrl+F6 


GooD 


Interrupt Execution Ctrl+C 
1.27 Shell 菜单 


O View Last Restart: 显示 最 近 一 次 的 输出 。 
Restart Shell: 重启 Shell， 清 理 运行 环境 。 
Interrupt Execution: 停止 正在 运行 的 程序 。 
Debug: 调试 〈 仅 Shell 窗口 )， 如 图 1.28 所 示 。 
Debug Options Window Hel 
Go to File/Line 
Debugger 


Stack Viewer 
Auto-open Stack Viewer 


图 1.28 Debug (调试 ) 菜单 
口 Goto File/Line: 跳 转 至 文件 或 行 。 
O Debugger: 打开 或 关闭 调试 器 ， 当 调试 器 打开 时 ，“ 断 点 设置 
将 出 现在 编辑 器 的 鼠标 右键 上 下 文 菜单 中 。 
Stack Viewer: 堆栈 查看 器 。 
Auto-open Stack Viewer: 自动 打开 堆栈 查看 器 。 
(7) Options: 选项 ， 如 图 1.29 所 示 。 
OQ Configure IDLE: 配置 IDLE， 单 击 后 打开 IDLE 设置 对 话 框 。 


O Code Context: 在 编辑 器 窗口 顶部 打开 窗 格 〈 仅 编辑 器 窗口 ) 。 
| Options Window He 


Configure IDLE 
Code Context 


图 1.29 Options (选项 ) 菜单 
(8) Window: 窗口 ， 如 图 1.30 所 示 。 
O Zoom Height: 拉 伸 窗口 高 度 ， 以 显示 更 多 行 。 


OO 
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其 他 选项 则 是 当前 打开 的 其 他 IDLE 窗口 ， 单 击 后 可 转 至 前 台 。 
Window Help 
Zoom Height Alt*2 


*Python 3.6.5 Shell* 
HelloWorld.py - D:WPython sourcecodeVielloWorld.py (3.6.5) 


Æ 1.30 Window (窗口 ) 菜单 
(9) Help: 帮助 ， 如 图 1.31 所 示 。 
O “About IDLE: 关于 IDLE， 显 示 版 本 和 版 权 等 信息 。 
O IDLE Help: 显示 帮助 文件 等 提示 。 
O ”Python Docs: 访问 本 地 Python 文档 ， 或 访问 在 线 文档 。 
口 Turtle Demo: 运行 turtledemo 示例 。 


[Heip] 


About IDLE 


IDLE Help 
Python Docs F1 
Turtle Demo 


1.31 Help GEB 菜单 
(10) Context: 鼠标 右键 上 下 文 菜单 ， 具 有 标准 的 剪贴 板 功能 和 编辑 菜 
单 功 能 ， 根 据 当 前 窗口 (Editor 或 者 Shell) 的 不 同 ， 此 菜单 功能 会 有 所 不 
同 ， 如 图 1.32 所 示 , 左边 是 编辑 器 窗口 上 下 文 菜 单 ， 右 边 为 Shell 窗口 上 下 
文 菜单 。 


Cut 
Copy 
Paste 


Cut 
Copy 


Set Breakpoint Pasie 


Clear Breakpoint Go to file/line 


1.32 Context (右键 ) 菜单 


O Cut 前 切 。 

口 Copy: 复制 。 

D) Paste: 粘贴 。 

U ”Set Breakpoint: 设置 断 点 。 
Q Clear Breakpoint: 清理 断 点 。 


U Gotofile/line: 跳 转 至 文件 或 行 。 

本 文 后 续 章 节 的 示例 中 , 代码 行 前 有 提示 符 >>> 的 , 均 可 在 Python IDLE 
Shell 窗口 中 直接 运行 。 
(14 实验 
除了 Python IDLE 之 外 ， 还 有 很 多 其 他 的 Python 集成 开发 工具 ， 一 般 
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都 具有 友好 的 使 用 界面 ， 以 及 语法 高 亮 、 代 码 跳 转 、 智 能 提示 和 自动 完成 
等 功能 ， 例 如 Thonny. Eclipse (with PyDev) 和 PyCharm 等 。 

本 节 将 安装 和 使 用 一 个 广 受 好 评 的 Python IDE —— PyCharm， 编 写 一 
个 节日 贺卡 的 小 程序 ， 目 的 是 使 用 比较 简单 的 代码 来 演示 PyCharm 的 使 用 
方法 ， 为 读者 选择 适合 的 Python 开发 工具 提供 参考 。 


1.4.1 PyCharm 的 安装 


PyCharm 是 JetBrains 推出 的 一 款 Python 的 集成 开发 环境 (IDEO, HH. 
备 一 般 IDE 的 常用 功能 ， 如 调试 、 语 法 高 亮 显示 、 项 目 管理 、 代 码 跳 转 、 
智能 提示 、 自 动 完成 和 版 本 控制 等 。 另 外 ，PyCharm 还 提供 了 一 些 用 于 
Django (一 种 基于 Python 的 Web 应 用 框架 ) 开发 的 功能 , 同时 支持 Google 
App Engine 和 IronPython. 

PyCharm 有 两 个 重要 版 本 一 一 社区 版 和 专业 版 ， 其 中 社区 版 是 免费 提 
供给 使 用 者 学 习 Python 的 版 本 ， 其 功能 可 以 满足 我 们 目前 的 学 习 需 求 ， 官 
方 下 载 地 址 为 http://wwwjetbrains.com/pycharm/download/。 当 然 如 果 对 功能 
有 更 高 要 求 ， 可 以 购买 专业 版 , 或 者 使 用 教育 机 构 的 邮箱 (edu.cn 域名 的 邮 
箱 ), 在 JetBrains 官网 注册 并 认证 后 , 获得 可 以 免费 使 用 更 多 功能 的 教育 版 。 
本 节 推 荐 使 用 PyCharm 的 社区 版 。 

(1) 在 官方 网 站 下 载 最 新 版 本 的 PyCharm 社区 版 ， 如 图 1.33 所 示 。 


O à ~ —— * ^t 


Ed Download PyCharm 


Professional Community 


图 1.33 PyCharm 下 载 
下 载 页 面 提 供 了 适用 于 Windows. macos 和 Linux 等 操作 系统 的 各 版 
本 PyCharm 下 载 ， 其 中 Professional (专业 版 ) HAH, Community CH: 
KO ERER (Lightweight) 的 免费 版 ， 这 里 单 击 Community (社区 版 》 
下 的 DOWNLOAD 按钮 下 载 该 版 本 。 
(2) 下 载 完成 后 双击 进入 安装 向 导 ， 如 图 1.34 所 示 。 
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PC Welcome to PyCharm Community 
Edition Setup 


Setup wil guide you through the instalation of PyCharm 
Community Editon. 


Itis recommended that you dose all other applications 


图 1.34 开始 安装 
(3) 单 击 Next 按钮 进入 下 一 步 ， 指 定安 装 的 位 置 ， 默 认 的 安装 目录 是 
C 盘 的 相应 目录 ， 这 里 我 们 改 成 了 D 盘 ， 如 图 1.35 所 示 。 


E3 PyCharm Community Edition Setup - x 


Choose Install Location. 
Choose the folder in which to install PyCharm Community Edition. 


Setup wil install PyCharm Community Edition in the following folder. To install in a different 
folder, dick Browse and select another folder. Cick Next to continue. 


Destination Folder. 
D} Program Fles JetBrains \PyCharm Community Edition 2018. 1.: Browse... 


Space required: 498.7 MB 
Space avaiable: 19.2 GB. 


«Bk [ Net» ] | Cancel 
图 1.35 安装 位 置 
(4) Hih Next 按钮 ， 进 入 Installation Options (安装 选项 ) 界面 ， 其 中 
选项 介绍 如 下 。 
口 Create Desktop Shortcut: 创建 桌面 快捷 方式 。 
WD 32bitlauncher: 32 位 启动 器 ， 适 用 于 32 位 操作 系统 。 
WO 64-bit launcher: 64 位 启动 器 ， 适 用 于 64 位 操作 系统 。 
(5) Create Associations: 创建 文件 关联 ， 使 得 PyCharm 与 Python 代码 
源 文件 ， 即 文件 名 后 缀 为 .py 的 文件 相关 联 ， 这 样 当 在 资源 管理 器 中 双击 .py 
的 文件 时 ，PyCharm 将 自动 启动 ， 并 打开 该 文件 ， 如 图 1.36 所 示 。 
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国 PyCharm Community Edition Setup. 


- x 
Installation Options 

[^7] Configure your PyCharm Community Editon instalaton 
Create Desktop Shortcut. 

D]xretincher  zjebtinunche 

Create Assocatons 

Bo 

€ crei 
图 1.36 ”安装 选项 


(6) 单 击 Next 按钮 ， 进 入 Choose Start Menu Folder (创建 开始 菜单 目 
录 ) 界面 ， 这 里 使 用 默认 值 ， 如 图 1.37 所 示 。 


B 
Choose Start Menu Folder 
Choose a Start Menu folder for the PyCharm Community Editon 
shortouts. 

Select the Start Menu folder in which 


you wouid lke to create the program's shortcuts. You 
Car also enter a name to create a new folder. 


J] 
Accessblty 


图 1.37 安装 
(7) 单 击 Install 按钮 开始 安装 ， 安 装 过 程 如 图 1.38 所 示 。 
B D 


B z 


Please wait whie PyCharm Community Editon is berg installed. 


E [rin 
图 1.38 安装 中 
(8) 安装 完成 ， 选 中 Run PyCharm Community Edition (运行 PyCharm) 
复 选 框 ， 然 后 单 击 Finish 按钮 完成 安装 ， 如 图 1.39 所 示 。 
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|i PyCharm Community Edition Setup 


Completing PyCharm Community 
Edition Setup 

PyCharm Community Editon has been instalied on your 
computer. 


Cik Finish to dose Setup. 


EZ Run PyCharm Community Edition. 


Rm] | cmd 
1.39 安装 完成 

(9) 单 击 Finish 按钮 后 ，PyCharm 开始 运行 ， 首 次 运行 需要 进行 简单 
配置 ， 界 面 上 的 选项 如 下 所 示 。 

Import PyCharm settings from: 导入 已 存在 的 PyCharm 设置 。 

OD Custom location, Config folder or installation home of the previous 

version: 自 定义 位 置 ， 配 置 文件 的 目录 或 上 一 版 本 的 安装 目录 。 

Q Do not import settings: 不 导入 任何 设置 。 

由 于 是 全 新 安装 ， 本 地 暂 无 其 他 任何 可 导入 的 配置 ， 这 里 选中 Do not 
import settings 单 选 按钮 即 可 ， 然 后 单 击 OK 按钮 ， 如 图 1.40 所 示 。 


E Complete installation 


x 
Import PyCharm settings from 


Osten location Config folder or installation home of the previous version 


@ Do sot isport settings 
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(10) 阅读 用 户 使 用 协议 ， 将 窗口 右 侧 的 滚动 条 拖 动 到 底部 ，Accept 按 
钮 上 的 字样 从 灰色 变 为 黑色 ， 单 击 该 按钮 同意 协议 ， 如 图 1.41 所 示 。 


ll PyChorm User License Agreement 


x 
Please read emd accept these terns und conditions: 

law for this service. 

Changes to this Policy 

This Privacy Policy is current as of the Effective Date set forth above. We 


Reaching out 
Vf you have any questions or concerns, or you feel that this Privacy Policy 


has been violated in any way, please let us know immediately by contacting 
priacyGjetbrains.com. 


[wm re 
141 用 户 许可 协议 
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(OD 同意 用 户 协 议 之 后 ， 会 出 现 Data Sharing (数据 共享 ) 的 提示 ， 
如 图 1.42 所 示 ， 意 为 是 否 愿 意 发 送 使 用 数据 和 统计 信息 ， 帮 助 JetBrains 持 
续 改 进 PyCharm， 窗 口 下 方 的 两 个 按钮 分 别 介绍 如 下 。 

O Send Usage Statistics: 发 送 使 用 过 程 中 的 统计 数据 。 

O ”Don't send: 不 发 送 。 

这 里 选择 Send Usage Statistics, 为 PyCharm 的 改进 做 一 点 小 小 的 贡献 。 

a 


Cr se] | eo 
图 1.42 数据 共享 


(12) 进入 PyCharm 启动 界面 ， 如 图 1.43 所 示 。 


图 1.43 启动 界面 


(13) 完成 启动 加 载 后 进入 PyCharm 欢迎 界面 ， 这 样 完成 了 PyCharm 
的 首次 安装 和 相关 配置 ， 如 图 1.44 所 示 。 


[gl Welcome to pcham x 


144 ”欢迎 界面 


e— 第 1 章 Python 3 概述 


1.4.2 实例; 节日 贺卡 
打开 PyCharm， 开 始 我 们 的 程序 编写 示例 。 
(1) 首先 新 建 一 个 项 目 。 单 击 Create New Project 选项 , 创建 新 的 Python 
项 目 ， 项 目 名 称 为 Python， 代码 存放 位 置 为 D 盘 的 Python 文件 夹 中 ， 如 
图 1.45 所 示 。 


[B em ti 
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(2) 单 击 Create 按钮 完成 项 目 创建 ， 进 入 控制 台 界面 ， 我 们 开始 创建 
Python 源 文件 demo01_04_01.py， 右 击 窗口 左 侧 Project 下 的 Python， 在 弹 
出 的 快捷 菜单 中 选择 New 一 Python File 命令 ， 创 建 过 程 如 图 1.46 所 示 。 


图 1.46 新 建文 件 流程 
(3) 在 弹出 的 New Python file 窗口 的 Name 文本 框 中 ， 输 入 文件 名 
demo01 04 01， 意 为 第 1 章 第 4 小 节 第 一 个 Python 示例 文件 ， 如 图 1.47 


所 示 。 


BÀ New Python file 
Name: [demoo1 04 o1| 
Kind: | i$ Python file v 
Cox] | ces | 
图 1.47 命名 新 文件 
(4) 单 击 OK 按钮 创建 完成 ，PyCharm 自动 打开 该 文件 ， 如 图 1.48 


所 示 。 
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国 python [DA python] - .Xdemo01 04 01.py [python] - PyCharm 

Ele Edit View Navigate Code Refactor Run Tools VCS Window Help 

Ba python ) 入 demo01 04 01.py ) 

EP Project ~ Qk ie I| f demo01 0401.py * | — 
v Ba python Dipython 


> Pivenv 


> llli External Libraries 
[3 Scratches and Consoles 


148 ”控制 台 界面 


(5) 在 PyCharm 中 编写 Python 程序 。 在 编写 时 ， 要 注意 添加 注释 ， 并 
注意 程序 内 的 缩 进 ， 如 图 1.49 所 示 。 


i demo01_04.01.py 


holiday = inpue( 请 输入 节日 :“) 
To_pame = input C 请 输入 收 件 人 的 姓名 :“) 
Vi name = input C 请 输入 送 件 人 的 姓名 : 


149 ”程序 内 容 


(6) 单 击 该 窗口 右上 角 的 绿色 三 角形 按钮 ， 或 按 ShifttF10 快捷 键 运行 
程序 ， 运 行 结果 如 图 1.50 所 示 。 


Run: ^ demo01.0401 - 
bot ARANA: Mirt 


x% p= 
eS. 
3 
m 
E] 

Li 


1.50 ”运行 结果 
关于 PyCharm 更 多 的 使 用 方法 ， 请 参考 “附录 CPyCharm 指南 ”。 


1.4.8 程序 剖析 


如 1.3.4 节 所 述 ， 在 程序 的 前 几 行 ， 我 们 在 该 程序 文件 的 开头 编写 了 注 
释 ， 简 单 说 明了 我 们 编写 的 这 个 程序 要 实现 的 功能 、 编 写 者 和 编写 时 间 等 ， 
便于 今后 对 这 个 程序 进行 后 续 的 修改 和 维护 。 

然后 ， 定 义 了 3 个 变量 : holiday. To name 和 Fr name, HH] input() 
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函数 接收 键盘 输入 的 字符 ,为 它们 赋值 。 最 后 ,使 用 printO 函 数 输出 贺卡 内 
容 ，print0 没 有 参数 时 输出 空 行 。 

在 每 个 代码 行 后 面 ， 我 们 使 用 了 ## 添 加 注释 ， 是 为 了 便于 大 家 的 阅读 和 
理解 ， 不 过 实际 项 目 中 可 能 不 需要 在 每 行 都 添加 注释 。 
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本 章 简单 介绍 了 Python. 的 发 展 历程 和 特性 Python 版 本 的 选择 、Python 
3.6.5 版 本 在 主流 操作 系统 上 的 安装 方法 、Python 自 带 的 集成 开发 和 学 习 环 
境 IDLE 的 使 用 方法 ， 以 及 另 一 种 Python 集成 开发 环境 PyCharm 的 安装 和 
使 用 。 

根据 IEEE Spectrum 于 2017 年 发 布 的 一 UE 显示 , Python 超越 
了 C 和 Java， 成 为 世界 上 最 受 欢迎 的 编程 语言 。 重 要 的 是 ，Python 这 种 简 
单 加 愉快 的 编程 语言 ， 在 全 球 掀起 了 学 习 和 使 用 的 热潮 ， 越 来 越 多 的 爱好 
者 和 团队 加 入 到 使 用 Python 开发 应 用 程序 的 行列 ， 可 以 预见 的 是 ，Python 
语言 必 将 成 长 得 更 加 强大 ， 更 加 精致 ， 更 加 完美 。 


\ 习题 


Ji 


、 单 项 选择 题 

. Python 语言 特点 众多 ， 以 下 ( ) 不 是 。 
.免费 B. 开源 C. 执行 效率 高 ”D. 面向 对 象 
. Python 的 注释 不 包括 ( js 

# B. // pc p. 
.print(1+2) 的 输出 是 〈 )。 

142 B. 1 c. 2 D. 3 
下 列 描述 错误 的 是 )。 

. Python 是 从 ABC 语言 发 展 而 来 

Python 是 一 门 高 级 计算 机 语言 

. Python 简单 易学 ， 可 读 性 高 

- Python 拥有 丰富 的 第 三 方 库 

Python 程序 源 文 件 的 扩展 名 是 〈 Je 

Python B. pyc C. pp D. py 
、 简 答题 

。 简 述 Python 语言 的 设计 特点 。 

2. 简 述 Python 2.X 和 Python 3.X 的 区 别 。 


a dd ROTE 
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三 、 编 程 题 
使 用 print0 函 数 输出 如 下 图 形 。 
eooooooooQQ 


eoo eooQ 
eoo qc qocoo 
eo ceo oo 
eoo qo ooo 
eooQ eooo 
eooooooooQQ 
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基本 语法 


Python 语言 ， 在 编程 语法 上 和 其 他 语言 有 很 多 相似 的 地 方 ， 如 Java. C 
等 ， 不 同 之 处 也 非常 明显 ， 这 恰恰 就 是 Python 易于 使 用 并 具有 “亲和力 ” 
的 地 方 。 

本 章 就 Python 的 语言 风格 、 标 识 符 命名 规则 、 基 本 语法 和 数据 类 型 进 
行 介绍 。 让 我 们 从 编码 风格 和 处 理 数 值 类 型 开始 ， 开 启 学习 Python 语言 的 
旅程 。 


2.1 PEPS 风格 指南 


Python Enhancement Proposal #8 是 Python 增强 提案 (Python Enhancement 
Proposals) 中 的 第 8 号 ， 缩 写 为 PEP8， 它 是 针对 Python 代码 格式 而 编订 的 
风格 指南 。 本 节 将 介绍 PEP8 的 部 分 内 容 ， 例 如 变量 、 函 数 和 方法 、 属 性 和 
类 、 模 块 和 包 等 关键 因素 的 命名 规则 ， 以 及 运算 符 等 相关 规定 ， 并 强烈 建 
议 读者 在 编写 Python 程序 源 代码 时 ， 应 该 遵循 该 指南 ， 可 以 使 项 目 更 利于 
多 人 协作 ， 并 且 后 续 的 维护 工作 也 将 变 得 更 容易 。 

当 使 用 某 些 内 置 了 PEP8 检查 工具 的 Python IDE 进行 开发 时 ， 用 户 编 
写 的 代码 将 会 被 自动 或 手动 按照 PEP8 规范 进行 检查 , 并 将 不 符合 规范 的 代 
码 以 波浪 线 或 高 亮 等 形式 给 出 相关 提示 。 


2.1.1 变量 


全 局 变量 使 用 英文 大 写 ， 单 词 之 间 加 下 画 线 。 
SCHOOL, NAME = Tsinghua University' # 学 校 名 称 
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全 局 变量 一 般 只 在 模块 内 有 效 ， 实 现 方法 : 使 用 _AlL_ 机 制 或 添加 一 
个 前 置 下 画 线 。 

私有 变量 使 用 英文 小 写 和 一 个 前 导 下 画 线 : 

_student_name 

内 置 变量 使 用 英文 小 写 ， 两 个 前 导 下 画 线 和 两 个 后 置 下 画 线 : 

. maker . 

一 般 变 量 使 用 英文 小 写 ， 单 词 之 间 加 下 画 线 : 

class_name 

变量 命名 规则 : 

O ”名称 第 一 个 字符 为 英文 字母 或 者 下 夯 线 。 

口 “ 名 称 第 一 个 字符 后 可 以 使 用 英文 字母 、 下 画 线 和 数字 。 

O ”名称 不 能 使 用 Python 的 关键 字 或 保留 字符 。 

O ”名称 区 分 大 小 写 ， 单 词 与 单词 之 间 使 用 下 画 线 连接 。 

Python 3 的 关键 字 和 保留 字 ， 可 以 从 Shell 命令 行 中 查看 ， 方 法 如 下 。 


>>> import keyword # 导 入 keyword 模块 
>>> keyword.kwlist #AA kwist 显示 保留 关键 字 列表 


['False', 'None', "True', 'and', 'as', 'assert', 'break', 'class', 'continue', 'def', 'del', 

'elif, 'else''except, "finally, 'for', 'from', 'global', 'if, 'import', 'in', 'is', 'lambda', 

"nonlocal', 'not', 'or', 'pass', 'raise', 'return', 'try', 'while', "with', 'yield'] 

还 可 以 使 用 keyword 的 iskeyword() 方 法 查看 某 个 字符 串 是 否 是 保留 关 
键 字 ， 如 果 返 回 值 是 True， 则 表示 该 字符 串 是 保留 关键 字 ;， 如 果 返 回 值 是 
False， 则 表示 该 字符 串 不 是 保留 关键 字 。 例 如 : 


>>> import keyword # 导 入 keyword 模块 

>>> keyword.iskeyword('pass') # 查 看 pass 是 否 是 保留 关键 字 
True # 是 保留 关键 字 

>>> keyword.iskeyword(fail") THE B fail 是 否 是 保留 关键 字 
False # 不 是 保留 关键 字 


2.1.2 ”函数 和 方法 


函数 名 是 英文 小 写 ， 单 词 之 间 加 下 画 线 ， 提 高 可 读 性 。 

函数 名 不 能 与 保留 关键 字 冲 突 ， 如 果 冲 突 ， 最 好 在 函数 名 后 面 添加 一 
个 后 置 下 画 线 ， 不 要 使 用 缩写 或 单词 拆 减 ， 最 好 的 方式 是 使 用 近义词 代替 。 

实例 方法 的 第 一 个 参数 总 是 使 用 self。 

类 方法 的 第 一 个 参数 总 是 使 用 cls。 
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2.1.3 ”属性 和 类 


类 的 命名 遵循 首 字 母 大写 CCapWords) 的 规则 ， 大 部 分 内 置 的 名 字 都 
是 单个 单词 (或 两 个 )， 首 字母 大 写 方式 只 适用 于 异常 名 称 和 内 置 的 常量 ， 
模块 内 部 使 用 的 类 采用 添加 前 导 下 画 线 的 方式 。 

类 的 属性 (方法 和 变量 ) 命名 使 用 全 部 小 写 的 方式 ， 可 以 使 用 下 画 线 。 
公有 属性 不 应 该 有 前 导 下 画 线 ， 如 果 公 有 属性 与 保留 关键 字 发 生 冲 突 ， 在 
属性 名 后 添加 后 置 下 画 线 。 对 于 简单 的 公有 数据 属性 ， 最 好 是 暴露 属性 名 ， 
不 使 用 复杂 的 访问 属性 或 修改 属性 的 方法 。 

如 果 该 类 是 为 了 被 继承 ， 有 不 让 子 类 使 用 的 属性 ， 给 属性 命名 时 ， 可 
以 给 它们 加 上 双 前 导 下 画 线 ， 不 要 加 后 置 下 画 线 。 

为 避免 与 子 类 属性 命名 冲突 ， 在 类 的 一 些 属性 前 ， 前 组 两 条 下 画 线 。 
例如 ， 类 Faa 中 声明 _a， 访 问 时 ， 只 能 通过 Faa. Faa a， 以 避免 歧义 。 


2.1.4 ”模块 和 包 


模块 命名 要 使 用 简短 的 小 写 英文 的 方式 ， 可 使 用 下 画 线 来 提高 可 读 性 。 

包 的 命名 和 模块 命名 类 似 ， 但 不 推荐 使 用 下 画 线 。 

模块 名 对 应 到 文件 名 ， 有 些 模块 底层 使 用 C 或 C++ 书写 ， 并 有 对 应 的 
高 层 Python 模块 ，C/C++ 模 块 名 有 一 前 置 下 画 线 。 


2.4.5 规定 
下 列 运 算 符 前 后 都 需 使 用 一 个 空格 : 


= + -< > == >= <== and or not 


下 列 运算 符 前 后 不 使 用 空格 : 


亲本 


更 多 PEP8 规则 ， 请 参考 “附录 APython 代码 风格 指南 : PEPS". 


22 ”变量 与 数据 类 型 


Python 语言 是 面向 对 象 (Object) 的 编程 语言 ， 可 以 说 在 Python 中 一 
切 皆 对 象 。 对 象 是 某 类 型 具体 实例 中 的 某 一 个 ， 每 个 对 象 都 有 身份 、 类 型 
和 值 。 

O “身份 (Identity) 与 对 象 都 是 唯一 对 应 关系 ,每 一 个 对 象 的 身份 

产生 后 就 都 是 独一无二 的 ， 并 无 法 改变 。 对 象 的 ID 是 对 象 在 
内 存 中 获取 的 一 段 地 址 的 标识 。 
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O 类 型 (Type) 是 决定 对 象 将 以 哪 种 数据 类 型 进行 存储 的 。 
O 值 (Value) 存储 对 象 的 数据 ， 某 些 情况 下 可 以 修改 值 ， 某 些 
对 象 声 明 值 过 后 就 不 可 以 修改 了 。 


2.2.1 变量 


指向 对 象 的 值 的 名 称 就 是 变量 ， 也 就 是 一 种 标识 符 ， 是 对 内 存 中 的 存 
储 位 置 的 命名 。 

对 于 不 同 的 对 象 ， 有 不 同 的 类 型 ， 得 到 的 内 存 地 址 也 不 一 样 ， 通 过 对 
得 到 的 地 址 进行 命名 得 到 变量 名 称 ， 我 们 将 数据 存 入 变量 ， 为 存储 的 数据 
设置 不 同 的 数据 结构 。 

变量 的 值 是 在 不 断 地 动态 变化 的 ，Python 的 变量 可 以 不 声明 直接 赋值 
使 用 。 由 于 Python 采用 动态 类 型 (Dynamic Type)， 变 量 可 以 根据 赋值 类 型 
决定 变量 的 数据 类 型 。 

在 Python 中 ， 变 量 使 用 等 号 赋值 以 后 会 被 创建 ， 定 义 完成 后 可 以 直接 
使 用 。 


2.2.2 ”变量 命名 规则 


Python 对 编码 格式 要 求 严格 ,对 变量 命名 建议 遵守 本 章 2.1.1 节 关 于 变 
量 命名 规则 部 分 。 

这 里 需要 说 明 的 是 ， 如 果 在 IDLE 或 PyCharm 中 编写 源 代码 使 用 了 
Python 的 关键 字 或 保留 字 (参见 本 章 2.1.1 节 )， 会 有 相应 的 提示 ， 或 以 颜 
色 加 以 区 分 。 


2.2.3 ”数据 类 型 


Python 有 可 以 自由 地 改变 变量 的 数据 类 型 的 动态 类 型 和 变量 事先 说 明 
的 静态 类 型 ， 特 定 类 型 是 数值 数据 存 入 相应 的 数据 类 型 的 变量 中 ， 相 比 之 
下 ， 动 态 数据 类 型 更 加 灵活 。 

变量 的 数据 类 型 有 多 种 类 型 ，Python 3 中 有 6 个 标准 的 数据 类 型 

O Numbers (数字 类 型 ) 。 

Strings (字符 串 类 型 ) 。 

O Lists (列表 类 型 )。 

口 Tuples (元 组 类 型 )。 

D) Dictionaries (字典 类 型 ) 。 

口 Sets (集合 类 型 ) 。 

其 中 字符 串 、 列 表 和 元 组 属于 序列 类 型 (Sequences), 字典 属于 映射 类 
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型 (Mappings)， 集 合 属于 集合 类 型 (Sets)， 在 后 面 章节 中 将 进行 详解 。 

数字 类 型 用 于 变量 存储 数值 ， 是 不 可 改变 的 〈Immutable) 数据 类 型 ， 
如 果 改 变数 字 类 型 就 会 分 配 一 个 新 的 对 象 。 下 面 我 们 了 解 一 下 数值 、 布 尔 
与 字符 串 类 型 。 

Python 内 置 的 数字 类 型 有 整 型 (Integers)、 浮 点 型 (Floating point 
numbers) 和 复数 (Complex numbers) 3 种 ， 作 为 可 以 进行 算术 运算 等 的 数 
据 类 型 。 

1. 整 型 (Integers) 

整数 类 型 (int) 简称 为 整 型 , 表示 整数 , 包括 正 整数 和 负 整 数 , 如 0110、 
-123. 123456789. 

Python 的 整 型 是 长 整 型 ， 能 表达 的 数 的 范围 是 无 限 的 ， 内 存 足 够 大 ， 
就 能 表示 足够 多 的 数 。 使 用 整 型 的 数 还 包括 其 他 进 制 ，0b 开始 的 是 二 进 制 
(binary), 0o 开始 的 是 八进制 (octonary )，0x 开始 的 是 十 六 进 制 
Chexadecimal)， 进 制 之 间 可 以 使 用 函数 进行 转换 ， 使 用 时 需要 注意 数值 符 
合 进 制 。 

使 用 内 置 函数 可 以 进行 进 制 的 转换 ， 格 式 说 明 如 下 。 

O bin(int): 将 十 进 制 数 转 为 二 进 制 ， 返 回 的 值 以 0b 开始 。 

Ub oct(nt): 将 十 进 制 数 转 为 八进制 ， 返 回 的 值 以 0o 开始 。 

O hex(int): 将 十 进 制 数 转 为 十 六 进 制 ， 返 回 的 值 以 0x 开始 。 

口 int(sbase): 将 字符 串 s 按照 base 参数 提供 的 进 制 转 为 十 进 制 值 。 

内 置 函数 inputO 输 入 值 时 ， 由 于 输入 的 是 字符 串 ， 需 要 使 用 intO 函 数 
转换 为 整 型 。 

2. 布尔 型 (Booleans) 

布尔 值 是 整 型 (Integers) 的 子 类 , 用 于 逻辑 判断 真 (True ) 或 假 (False)， 
用 数值 1 和 0 分 别 代表 常量 True 和 False. 

在 Python 语言 中 ，False 可 以 是 数值 为 0、 对 象 为 None 或 者 是 序列 中 
的 空 字 符 串 、 空 列表 、 空 元 组 。 

3. 浮 点 型 〈Float) 

浮 点 型 (Float) 是 含有 小 数 的 数值 ， 用 于 表示 实数 ， 由 正 负 号 、 数 字 
和 小 数 点 组 成 ， 正 号 可 以 省 略 ， 如 -3.0、0.13、7.18。Python 的 浮 点 型 执行 
IEEE 754 双 精 度 标准 ，8 个 字 节 一 个 浮 点 ， 范 围 为 -1.8 5— 11.875 的 数 均 可 
以 表示 。 

浮 点 型 方法 如 下 。 

U fromhex(s): 十 六 进 制 浮 点 数 转换 为 十 进 制 数 。 

O hex0: 以 字符 串 形式 返回 十 六 进 制 的 浮 点 数 。 
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O ids integer): 判断 是 否 为 小 数 ， 小 数 非 零 返回 False， 为 零 返回 
True， 转 换 为 布尔 值 。 

4. 复数 类 型 (Complex) 

复数 类 型 (Complex〉 由 实数 和 虚数 组 成 ， 用 于 复数 的 表示 ， 虚 数 部 分 
需 加 上 j 或 J 如 -1j、0j、1.0j。Python 的 复数 类 型 是 其 他 语言 一 般 没有 的 。 

5. 字符 串 类 型 (Strings) 

字符 串 (Strings) 用 于 Unicode 字符 序列 ， 使 用 一 对 单 引 号 、 双 引号 和 
使 用 三 对 单 引 号 或 者 双 引 号 引起 来 的 字符 就 是 字符 串 ， 如 hello world'、 
"20180520"、"hello"、"""happyl"""。 

严格 地 说 , 在 Python 中 的 字符 串 是 一 种 对 象 类 型 ， 使 用 str 表示 , 通 
常用 单 引 号 CO 或 者 双 引 号 CO AREK. 

字符 串 和 前 面 讲 过 的 数字 一 样 ， 都 是 对 象 的 类 型 ， 或 者 说 都 是 值 。 如 
果 不 想 让 反 斜 杠 发 生 转 义 ,， 可 以 在 字符 串 前 面 加 一 个 rz 表示 原 始 字符 串 , 加 
号 GO 是 字符 串 的 连接 符 ， 星 号 CO 表示 复制 当前 的 字符 串 ， 紧 跟 的 数 
字 为 复制 的 次 数 。 


2.2.4 type() 函数 


type(O) 函 数 是 内 建 的 用 来 查看 变量 类 型 的 函数 ， 调 用 它 可 以 简单 地 查看 
数据 类 型 ， 基 本 用 法 如 下 : 


type( 对 象 ) 

对 象 即 为 需要 查看 类 型 的 对 象 或 数据 ， 通 过 返回 值 返回 相应 的 类 型 ， 
例如 : 

>>> type(1) # 查 看 数值 1 的 数据 类 型 

«class 'int> # 返 回 结果 

>>> type("int") # 查 看 "int" 的 数据 类 型 

«class 'str> # 返 回 结果 


Python 中 一 切 皆 对 象 ， 并 且 Python 不 支持 方法 或 函数 重 载 ， 必 须 保证 
调用 的 函数 或 对 象 是 正确 的 。 在 一 个 对 象 是 什么 类 型 时 使 用 type0, 返回 任 
意 Python 对 象 的 类 型 ， 而 且 不 局 限于 标准 类 型。 


2.2.5 ”数据 类 型 的 转换 
转换 为 整 型 int 类 型 : 
int(x [,base]) 


intO 函 数 将 x 转换 为 一 个 整数 ，x 为 字符 串 或 数字 ，base 为 进 制 数 ， 默 
认为 十 进 制 。 


>>> int(100.1) APAREA 

100 # 返 回 结果 

>>> int(01010101',2) # 二 进 制 转换 整数 
85 # 返 回 结果 
转换 为 浮 点 型 float 类 型 : 

float(x) 


float(0) 函 数 将 x 转换 为 一 个 浮 点 数 ，x 为 字符 串 或 数字 ， 没 有 参数 时 默 
认 返 回 0.0. 


>>> float() # 空 值 转换 
0.0 # 返 回 结果 
>>> float(1) # 整 数 转 浮 点 
1.0 # 返 回 结果 
>>> float(120") # 字 符 转 浮 点 
120.0 的 反 回 结果 
转换 为 字符 串 str 类 型 : 

str(x) 


str() 函数 将 对 象 转化 为 适 于 人 阅读 的 形式 ，x 为 对 象 ， 返 回 值 为 对 象 
的 string 类 型 。 
>>> X = "今天 是 畏 天” ”# 定 义 x 


>>> str(x) 3x] x 进行 转换 
' 今 天 是 晴天 ' # 返 回 结果 
转换 为 布尔 值 布尔 类 型 : 

bool(x) 


bool) 函数 用 于 把 给 定 参 数 转换 为 布尔 类 型 ,返回 值 为 True 或 者 False， 
在 没有 参数 的 情况 下 默认 返回 False。 


>>> bool() # 空 置 转 布尔 类 型 
False 3t [ol RR 

>>> bool(0) # 整 数 0 转 布尔 值 
False # 返 回 结果 

>>> bool(1) EET 1 转 布尔 值 
True # 返 回 结 果 

>>> bool(100) # 整 数 100 转 布尔 值 
True # 返 回 结 果 


Python 中 常用 的 数据 类 型 有 整数 (int)、 字 符 串 (str)、 布 尔 值 (bool)、 
列表 (list)、 元 组 (tuple)、 字 典 (dict)、 浮 点 数 〈float)、 复 数 (complex)、 
可 变 集合 (set)， 它 们 之 间 可 以 按 规则 互相 转化 。 
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2.3.1 算术 运算 符 


算术 运算 符 主要 是 用 于 数字 类 型 的 数据 基本 运算 ，Python 支持 直接 进 
行 计 算 ， 就 是 可 以 将 Python Shell 当 计算 器 来 使 用 ， 如 表 2.1 所 示 。 


表 2.1 算术 运算 符 


运算 符 说 明 表达 式 结果 
十 加 : 把 数据 相 加 10+24 34 
去 Jk: 把 数据 相 减 34-10 10 


* 乘 ， 把 数据 相 科 340 
/ 除 ， 把 数据 相 除 34 
" 取 横 ， 除 法 运算 求 余数 4 
+ TE: 返回 x 的 y VOR 16 
i NOR. 返回 商 整数 部 分 3 


* 可 以 返回 重复 若干 次 的 字符 串 。 
2.3.2 ”比较 运算 符 


比较 运算 符 用 于 判断 同类 型 的 对 象 是 否 相等 ， 比 较 运算 的 结果 是 布尔 
{È True 或 False， 比 较 时 因数 据 类 型 不 同 ， 比 较 的 依据 不 同 ， 如 表 2.2 所 示 。 
复数 不 可 以 比较 大 小 ， 但 可 以 比较 是 否 相等 。 在 Python 中 比较 的 值 相同 时 
也 不 一 定 是 同一 个 对 象 。 


表 2.2 比较 运算 符 
运算 符 说 明 结果 
一 等 于 ， 判 断 是 否 相等 True 
= TORT: 判断 是 否 不 相等 False 
> 大 于 : 判断 是 否 大 于 False 
< 小 于 : 判断 是 否 小 于 True 
> 一 大 于 等 于 : 判断 是 否 大 于 等 于 False 
<= 小 于 等 于 : 判断 是 否 小 于 等 于 True 


2.8.8 ”逻辑 运算 符 
逻辑 运算 符 and (与 )、or CR), not GE) 用 于 逻辑 运算 判断 表达 式 的 


True 或 者 False， 通 常 与 流程 控制 一 起 使 用 ， 如 表 2.3 所 示 。 
X23 ”逻辑 运算 符 


and 


xandy 


表达 式 一 边 有 False 就 会 
False， 当 两 边 都 是 True ema 


表达 式 一 边 有 True 就 会 返回 
True， 当 两 边 都 是 False 时 返回 


反 ， 返 回 值 与 原 值 相反 


2.3.4 ”复合 赋值 运算 符 


复合 赋值 运算 符 是 将 一 个 变量 参与 运算 的 运算 结果 赋值 给 该 变量 , 即 a 


参加 了 该 运算 ， 运 
算 符 及 其 对 应 的 等 效 表 


后 是 由 a， 表 2.4 列举 了 可 以 这 样 使 用 的 运 
达 式 。 
R24 ”复合 赋值 运算 符 


运算 符 说 明 等 效 表 达 式 
= 直接 赋值 x-zty 
+= 加 法 赋值 x-x*y 

== 减法 赋值 x=x-y 
*= 乘法 赋值 x=x*y 
= 除法 赋值 x-x/y 
%= 取 模 赋值 x-x96y 
= USC x-x*"*y 
/人 = 整除 赋值 x=x//y 
2.3.5 ”运算 符 优先 级 


由 数值 、 变 量 、 运 算 符 组 合 的 表达 式 和 数学 中 的 表达 式 相同 ， 是 有 运 
算 符 优先 级 的 ， 优 先 级 高 的 运算 符 先进 行 运算 ， 同 级 运算 符 自 左 向 右 运算 ， 


遵从 小 括号 优先 原则 。 等 号 的 同 级 运算 时 例外 ， 一 般 都 是 自 右 向 左 进行 运 
算 ， 如 表 2.5 所 示 。 
表 2.5 运算 符 优先 级 
优先 级 说 明 
最 高 | 算术 运算 符 *»* d m 
高 位 运算 符 +x,- Xx 正 取 反 ， 负 取 反 ， 按 位 取 反 
算术 运算 符 * [90 .// R, Dk, Hui, Ho 


算术 运算 符 in, wk 


Hii, ENN 
maan |a sts. n 


[iann | enan, 


集合 对 称 差 


masae 。 || pets deor 


——7À MT. 


赋值 运算 
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24 ”实验 
2.4.1 用 常量 和 变量 


小 于 ， 大 于 ， 大 于 等 于 


等 于 ， 不 等 于 


Python 中 在 程序 运行 时 不 会 被 更 改 的 量 称 之 为 常量 ， 是 一 旦 初始 化 后 


就 不 能 修改 的 固定 值 。Python 中 定义 常量 需要 用 对 象 的 方法 来 创建 ， 下 面 


我 们 来 进行 常量 的 实验 演示 。 
现在 有 直径 为 68cm 的 下 水 道 井 盖 ， 需 要 求 


面积 ， 其 中 工 直接 使 用 数学 


库 中 的 pi, pi 即 为 Python 中 的 常量 。 


实验 实例 如 下 : 

>>> from math import * #3 引入 数学 库 

>>> pi*(68/2)**2 # 计 算 
3631.681107549801 # 计 算 结 果 

>>> int(pi*(68/2)**2) HREH int 类 型 


3631 # 返 回 取 整 的 结果 


Python 中 变量 不 需要 声明 ， 使 用 等 号 直接 赋值 ， 值 的 数据 类 型 为 动态 
类 型 , 也 可 以 使 用 等 号 为 多 个 变量 赋值 。 我 们 为 a、b、c 分 别 赋 值 为 “Python 
编程 ”“3.6” 和 “2018”， 然 后 输出 “2018Python 编程 3.6”， 接 着 计算 b 和 


c 的 和 ， 再 输出 a 的 内 容 。 
实验 实例 如 下 : 


>>> a , b , c = Python 编程 ,3.6,2018 
>>> print(str(c) + a + str(b)) 
2018Python 编程 3.6 

>>>b+c 

2021.6 

>>>a 


"Python 编程 ' 


2.4.2 ”用 运算 符 和 表达 式 


# 定 义 变量 和 赋值 
SHTED 

府 J 印 结果 

IS bsc 

# 计 算 结果 

# 输 出 a 的 内 容 
# 输 出 


由 于 Python Shell 可 以 直接 当 计 算 器 使 用 , 输入 表达 式 后 可 以 直接 计算 
出 结果 ， 也 可 以 使 用 变量 。 下 面 计算 2 的 3 次 方 加 上 3 乘 5 除 以 10 再 加 上 
2 加 1 的 结果 ， 先 使 用 直接 计算 ， 再 使 用 变量 。 


实验 实例 如 下 : 

2221-42 -3'540-2'*3 
12.5 

>>>a=1+2+3*5/10 + 2**3 
>>> print (a) 

12.5 


2.4.3 type() 函 数 的 使 用 


# 输 入 表达 式 
# 返 回 计 算 结 果 


# 给 变量 a 赋值 的 表达 式 


# 输 出 变量 
# 返 回 计算 结果 


type0 函 数 是 Python 内 置 的 函数 , 用 于 返回 数据 类 型 ， 当 我 们 要 对 一 个 


变量 赋值 时 ， 先 要 确定 变量 的 数据 类 型 ， 就 会 使 用 到 type0) 函 数 。 下 


pi 和 一 些 变量 进行 ypeO 函 数 的 使 用 实验 。 


实验 实例 如 下 : 


>>> from math import * 
>>> type(pi) 

«class float> 
ELE 

>>> b = "python" 
>>>C=2.5 

>>> 

>>> type(a) 

<class 'int> 


>>> type(b) 


# 导 入 数学 库 

# 查 询 pi 的 数据 类 型 
3B [8] float 类 型 

# 定 义 变量 a 并 赋值 
# 定 义 变量 b 并 赋值 
# 定 义 变量 c 并 赋值 


# 查 询 a 的 数据 类 型 
388 [8l int 类 型 
# 查 询 b 的 数据 类 型 


而 将 对 


«class 'str> 36 [il str 类 型 
>>> type(c) # 查 询 c 的 数据 类 型 
«class float» # 返 回 float 类 型 


2.4.4 _ help() 函 数 的 使 用 


帮助 
文档 
数 和 
减 )。 


help() 函数 是 Python 内 置 用 于 查看 函数 或 模块 用 途 的 详细 说 明文 档 的 
函数 。 在 Python 语言 中 有 很 多 的 函数 ， 一 般 在 定义 函数 时 会 加 上 说 明 


， 说 明 函 数 的 功能 以 及 使 用 方法 。 下 面 通过 查看 print0) 函 数 、input0 函 
一 些 数据 类 型 来 进行 help0 函 数 的 使 用 实验 (部 分 文档 内 容 进行 了 删 
实验 实例 如 下 : 

>>> help(print) # 查 询 print() 函 数 的 帮助 

Help on built-in function print in module builtins: 

print(...) 


print(value, ..., sep-' ', end='\n', file-sys.stdout, flush-False) 
Prints the values to a stream, or to sys.stdout by default. 
Optional keyword arguments: 
file: a file-like object (stream); defaults to the current sys.stdout. 
sep: string inserted between values, default a space. 
end: string appended after the last value, default a newline. 
flush: whether to forcibly flush the stream. 

»»» help(input) # 查 询 input() 函 数 的 帮助 

Help on built-in function input in module builtins: 

input(prompt-None, /) 
Read a string from standard input. The trailing newline is stripped. 
The prompt string, if given, is printed to standard output without a 
trailing newline before reading input. 
If the user hits EOF (*nix: Ctrl-D, Windows: Ctrl-ZReturn), raise EOFError. 
On *nix systems, readline is used if available. 

>>> help("int") # 查 询 int 的 使 用 说 明 

Help on class int in module builtins: 

class int(object) 

int(x=0) -> integer 

int(x, base=10) -> integer 


Convert a number or string to an integer, or return 0 if no arguments 
are given. If xis a number, return x. int () For floating point 
numbers, this truncates towards zero. 


>>> help("float") # 查 询 float 的 使 用 说 明 
Help on class float in module builtins: 
class float(object) 


| float(x) -> floating point number 


部 分 略 


25 ”小结 


本 章 主要 对 Python 的 代码 风格 、 变 量 、 数 据 类 型 、 运 算 符 进行 了 简单 
讲解 ， 都 是 学 习 Python 语言 的 基础 知识 ， 希 望 大 家 在 学 习 时 多 加 理解 ， 对 
代码 风格 也 要 多 加 记忆 和 练习 ， 对 Python 的 变量 和 运算 符 要 经 常 使 用 ， 加 
深 印 象 ， 为 后 面 更 好 地 学 习 Python 做 准备 。 


习题 


一 、 填 空 题 

1. 在 Python 中 ，float 的 数据 类 型 是 如 何 表达 的 (实例 ) 

2. Int 类 型 的 数据 转换 为 布尔 值 类 型 的 结果 有 和 

3. 要 查询 变量 的 类 型 可 以 用 。 

4. 运算 符 中 优先 级 最 高 的 是 o 

5. Python 中 的 数据 类 型 分 为 。 T X3. bool 是 哪 一 个 大 类 中 的 


o 


二 、 选 择 题 
1. ERRORE C  )。 
A. * B. / C x D. & 


2. 使 用 ) 函数 可 以 查看 函数 的 相关 文档 。 
A. type() B. help() C. print) D. input) 
3. int0 可 以 将 数据 类 型 转换 为 ( Jo 


A. bool B. int C. float D. long 
4. float(0) 的 返回 结果 是 〈 )。 
A. 0 B. / C. 00 D. 错误 


5. 下 列 是 str 类 型 的 是 ( Je 

A. 123 B. python C423. pi [23 
三 、 简 答题 

简 述 PEPS 的 意义 。 
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流程 控制 


流程 控制 是 指 在 程序 运行 时 ， 对 指令 运行 顺序 的 控制 。 

通常 ， 程 序 流程 结构 分 为 3 种 : 顺序 结构 、 分 支 结构 和 循环 结构 。 顺 
序 结构 是 程序 中 最 常见 的 流程 结构 ， 按 照 程序 中 语句 的 先后 顺序 ， 自 上 而 
下 依次 执行 , 称 为 顺序 结构 ;分 支 结构 则 根据 直 条 件 的 真 假 (True 或 者 False) 
来 决定 要 执行 的 代码 ;循环 结构 则 是 重复 执行 相同 的 代码 ， 直 到 整个 循环 
完成 或 者 使 用 break 强制 跳出 循环 。 

Python 语言 中 ， 一 般 来 说 ， 我 们 使 用 if 语句 实现 分 支 结构 ， 用 for 和 
while 语句 实现 循环 结构 。 


3.1 REA 


条 件 语句 是 用 来 判断 给 定 的 条 件 是 否 满足 ， 并 根据 判断 的 结果 (Tme 
或 False) 决定 是 否 执行 或 如 何 执行 后 续 流 程 的 语句 ， 它 使 代码 的 执行 顺序 
有 了 更 多 选择 ， 以 实现 更 多 的 功能 。 

一 般 来 说 ， 条 件 表 达 式 是 由 条 件 运 算 符 和 相应 的 数据 所 构成 的 ， 在 
Python 中 ， 所 有 合法 的 表达 式 都 可 以 作为 条 件 表达 式 。 条 件 表达 式 的 值 只 
要 不 是 False、0、 空 值 (None)、 空 列表 、 空 集合 、 空 元 组 、 空 字符 串 等 ， 
其 他 均 为 True。 


流程 图 ， 是 使 用 图 形 来 表示 流程 控制 的 一 种 方法 ， 是 一 种 传统 的 算法 
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表示 方法 ， 用 特定 的 图 形 符号 和 文字 对 流程 和 算法 加 以 说 明 ， 叫 作 算法 的 
图 ， 也 称 为 流程 图 。 俗 话说 千言 万 语 不 如 一 张 图 。 

流程 图 有 它 自己 的 规范 ， 按 照 这 样 的 规范 所 画 出 的 流程 图 ， 便 于 技术 
人 员 之 间 的 交流 ， 也 是 软件 项 目 开发 所 必 备 的 基本 组 成 部 分 ， 因 此 画 流程 
图 也 应 是 开发 者 的 基本 功 。 

在 后 续 章节 中 ， 为 了 更 方便 和 直观 地 展示 各 种 流程 控制 的 原理 ， 我 们 
将 使 用 流程 图 来 描述 它们 ， 流 程 图 的 基本 元 素 如 表 3.1 所 示 。 


表 3.1 流程 图 的 基本 元 素 


圆 角 和 矩形 用 来 表示 “开始 ”与 “结束 ” 
和 拢 形 用 来 表示 要 执行 的 动作 或 算法 


菱形 用 来 表示 问题 判断 
平行 四 边 形 用 来 表示 输入 /输出 
箭头 用 来 代表 工作 流 方向 


3.2 条 件 流程 控制 


if 语句 是 由 让 发 起 的 一 个 条 件 语句 ， 在 满足 此 条 件 后 执行 相应 内 容 ， 
Python 的 语句 基本 结构 如 下 ， 流 程 图 如 图 3.1 所 示 。 


if 表达 式 1: rae 
语句 块 1 dist 
elif 表达 式 2: gt 
语句 块 2 True 
* * - 
else: | 语句 块 1 | 语句 块 2 语句 块 m 
语句 块 n 


y 
图 3.1 分 支 选 择 结构 
这 里 的 elif， 为 else if 的 缩写 ， 同 时 需要 注意 以 下 几 点 。 
CD else, elif 为 让 语 句 的 子 语句 块 ， 不 能 独立 使 用 。 
(2) 每 个 条 件 后 面 要 使 用 冒号 “:” 表示 满足 条 件 后 需要 执行 的 语句 块 ， 
后 面 几 种 其 他 形式 的 选择 结构 和 循环 结构 中 的 冒号 也 是 必须 要 有 的 。 
G) 使 用 缩 进来 划分 语句 块 ， 相 同 缩 进 数 的 语句 组 成 一 个 语句 块 。 
(4) 在 Python 中 没有 switch...case 语句 。 


3.2.1 单 向 条 件 (if...) 


单 向 分 支 选择 结构 是 最 简单 的 一 种 形式 ， 不 包含 elif 和 else， 其 语法 如 
下 ， 流 程 图 如 图 3.2 所 示 。 

if KER: 

语句 块 
当 表 达 式 值 为 True 时 ， 执 行 语句 块 ， 否 则 该 语句 块 不 执行 ， 继 续 执行 
后 面 的 代码 。 


True False 


语句 块 


: 


图 3.2 单 分 支 选择 结构 
例如 ， 判 断 变量 a〈 条 件 表 达 式 ) 的 值 是 否 为 True， 是 则 执行 a = 0, 
否则 直接 输出 a 的 值 。 


>>>a=1 
>>> İf a: # 等 价 于 a>0 或 al=0 
a=0 


>>> print(a) sn5R if 41891879 False 则 输出 结果 为 1 
运行 结果 如 下 : 
0 


3.2.2 ”双向 条 件 语句 (if...else ) 


双 分 支 语句 由 if AI else 两 部 分 组 成 ， 当 表达 式 的 值 为 True 时 ， 执 行 语 
句 块 1， 否 则 执行 语句 块 2。 双 分 支 选择 结构 的 语法 如 下 ， 流 程 图 如 图 3.3 


所 示 。 
if 表达 式 : =e 
语句 块 1 EST OX] 
else: 
语句 块 2 I 


图 3.3” 双 分 支 选 择 结构 
例如 ,判断 条 件 表达 式 的 值 是 否 为 Tme， 是 则 执行 语句 块 1， 否则 执行 
else 部 分 ， 最 后 再 输出 a 的 值 ， 这 里 要 特别 注意 代码 缩 进 。 
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>>>a=5 
>>>ifa<0: 38AIl: a 是否 小 于 0 

a=10 

print(a + 1) # 如 果 if 的 条 件 为 True， 就 输出 11 

else: 

a=15 

print(a + 2) # 如 果 if 的 条 件 为 False， 就 输出 17 
>>> print(a) 


运行 结果 如 下 : 


17 
15 


3.2.3 ”多 向 条 件 语句 (if...elif...else ) 


多 分 支 选择 结构 由 站 、 一 个 或 多 个 elif 和 一 个 else 子 块 组 成 ，else FIR 
可 省 略 。 一 个 站 语句 可 以 包含 多 个 elif 语句 ， 但 结尾 最 多 只 能 有 一 个 else。 
多 分 支 选择 结构 的 语法 如 下 ， 流 程 图 如 图 3.4 所 示 。 


if 表达 式 1: 
语句 块 ] Ed 
elif 表达 式 2: aue dna. False 
语句 块 2 
elif 表达 式 3: me 
语句 块 3 - : 
idis ia] [wee] [is itn 
else: 
语句 块 n + 


34 多 分 支 选择 结构 
例如 ， 根 据 你 身上 带 的 钱 ， 来 决定 你 今天 中 午 能 吃 什么 。 
>>> money = float(input(" 请 输入 你 带 的 钱 :")) 


请 输入 你 带 的 钱 : 50 
>>> if (money >= 1) and (money <= 5): ” 撞 断 money 是 否 在 1~5 
print(" 你 可 以 吃 包 子 ") 
elif (money > 5) and (money <= 10): # 境 I 断 money 是 否 在 6 一 10 
print(" 你 可 以 吃 面条 ") 


elif money < 0: 
# 如 果 money 小 于 0， 就 说 明 你 没有 钱 ， 否 则 就 说 明 你 的 钱 大 于 10 元 
print(" 你 的 钱 不 够 ) 
else: 


print(" 你 可 以 吃 大 餐 ) 
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运行 结果 如 下 
你 可 以 吃 大 餐 


3.2.4 RRE 


选择 结构 可 以 进行 嵌 套 来 表达 更 复杂 的 逻辑 关系 。 使 用 选择 结构 嵌 套 
时 ， 一 定 要 控制 好 不 同 级 别 的 代码 块 的 缩 进 ， 否 则 就 不 能 被 Python 正确 理 
解 和 执行 。 在 让 语句 嵌 套 中 ， if 让 else、 下..elif .else 它们 可 以 进行 一 次 
或 多 次 相互 嵌 套 ， 结 构 流 程 图 如 图 3.5 所 示 。 

if 表达 式 1: 

语句 块 1 

if 表达 式 2: 

语句 块 2 
else: 

if 表达 式 3: 

语句 块 3 
else: 


语句 块 4 


图 3.5 ARARE 
例如 ， 请 输入 一 个 正 整数 ， 判 断 它 是 否 能 同时 被 2 和 3 整除 。 


>>> a = int(input(" 请 输入 一 个 正 整数 : ")) 
请 输入 一 个 正 整 数 : 666 


>>> if a % 2 == 0: 388g — DRETA 2 整除 
if a % 3 == 0: # 判 断 一 个 数 是 否 能 被 3 整除 
print(a) 
else 


print(" 此 数 能 够 被 2 整除 ， 但 是 不 能 被 3 整除 ! ") 
else: 


printt" 此 数 不 能 被 2 整除 ! ") 
运行 结果 如 下 : 
666 


3.3 ”循环 流程 控制 

循环 ， 是 我 们 生活 中 常见 的 ， 如 每 天 都 要 吃饭 、 上 课 、 睡 觉 等 ， 这 就 
是 典型 的 循环 。 循 环 结构 是 指 在 程序 中 需要 反复 执行 某 个 功能 而 设置 的 一 
种 程序 结构 。 


45 —e 
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Python 提供 for 和 while 两 种 循环 语句 。for 语句 用 来 遍历 序列 对 象 内 的 
元 素 ， 通 常用 在 已 知 的 循环 次 数 ，while 语句 提供 了 编写 通用 循环 的 方法 ， 
流程 图 如 图 3.6 所 示 。 


图 3.6 循环 流程 图 
3.3.1 for 循环 


for 循环 的 语法 结构 与 前 面 讲 的 站 ..else 有 点 类 似 ， 不 要 记 混淆 了 。for 
循环 语法 结构 如 下 所 示 。 
for 变量 in 序列 或 迭代 对 象 : 
循环 体 (语句 块 1) 
else: 
语句 块 2 
for 执行 时 ， 依 次 将 可 迭代 对 象 中 的 值 赋 给 变量 ， 变 量 每 赋值 一 次 ， 则 
执行 一 次 循环 体 。 循 环 执行 结束 时 ， 如 果 有 else 部 分 ， 则 执行 对 应 的 语句 
块 。else 只 有 在 循环 正常 结束 时 执行 。 如 果 使 用 break 跳出 循环 ， 则 不 会 执 
{T else 部 分 ， 且 根据 实际 编程 需求 ，else 部 分 可 以 省 略 。 
注意 for 和 else 后 面 的 冒号 不 能 丢 ， 循 环 体 、 语 句 块 缩 进 要 严格 对 齐 。 
例如 ， 求 1-100 的 累加 和 ，range0 函 数 是 生成 1 一 100 的 整数 ，Sum 是 


累加 的 和 。 
>>> Sum =0 
>>> forsin range(1, 101): ”# 循 环 从 1~~100， 当 101 时 就 退出 循环 
Sum +=s #R 1—-100 的 累加 和 
>>> print(Sum) 
运行 结果 如 下 : 
5050 
例如 ， 删 除 列表 对 象 中 所 有 的 偶数 。 
>>> x = list(range(20)) # 创 建 列表 对 象 


>>> for i in x: # 从 0 循环 到 19 


-e— =] Tr 
x.remove(i) # 删 除 列表 对 象 中 下 标 为 i 的 值 
else: 
print("delete over") #for 循环 正常 执行 完成 后 , 执行 的 else 部 分 
>>> print(x) IH X 
运行 结果 如 下 : 
delete over 


[1, 3, 5, 7, 9, 11, 13, 15, 17, 19] 
第 一 次 执行 时 ， 列 表 对 象 和 变量 i 的 值 都 为 0， 所 以 删除 的 就 是 下 标 为 


0 的 数 。 当 删除 完 后 列表 对 象 中 的 所 有 数 都 向 前 移动 , 下 标 为 0 的 数 现在 就 
变 成 了 1。 第 一 次 循环 执行 完成 后 ，i 的 值 要 加 1， 第 二 次 循环 要 删除 的 是 
下 标 为 1 的 数 。 现 在 下 标 为 1 的 数 是 2， 那 么 第 二 次 删除 的 就 是 2， 然后 列 
表 中 的 数 再 向 前 移动 。 以 此 类 推 就 能 删除 所 有 偶数 。 如 果 想 删除 所 有 奇数 ， 
要 怎么 做 呢 ? 


3.3.2 for EHRE 


for HARE ETE for 循环 里 有 一 个 或 多 个 for 语句 , A EPHE 


一 层 循环 的 叫 双重 循环 ， 媒 套 两 层 以 上 的 叫 多 重 循环 。 


数 ， 


例如 ， 使 用 两 个 for 循环 打印 出 九 九 乘法 表 ， 使 用 for 循环 和 range) FR 
变量 i 控制 外 层 循环 ， 变 量 j 是 控制 内 层 循环 的 次 数 。 
>>> for i in range(1, 10): # 外 循环 循环 9 次 


for j in range(1, i + 1): # 内 循环 控制 每 行 输出 的 个 数 
print(str(j) + "x" + str(i) + '=' + str(i * j), end=" ") 


# 把 数值 类 型 转换 成 字符 型 然后 进行 输出 
print() # 换行 
运行 结果 如 下 : 
1x1=1 
1x2=2 2x2=4 


1x3=3 2x3=6 3x3=9 

1x4=4 2x4=8 3x4=12 4x4=16 

1x5=5 2x5=10 3x5=15 4x5=20 5x5=25 

1x6=6 2x6=12 3x6=18 4x6=24 5x6=30 6x6=36 

1x7=7 2x7=14 3x7=21 4x7=28 5x7=35 6x7=42 7x7=49 

1x8=8 2x8=16 3x8=24 4x8=32 5x8=40 6x8=48 7x8=56 8x8=64 

1x9=9 2x9=18 3x9=27 4x9=36 5x9=45 6x9=54 7x9=63 8x9=72 9x9=81 


例如 ， 求 1! 921 43! +4! +…+10! 的 和 。 


>>> Sum =0 
>>> foriin range(1, 11): # 外 循环 完成 累加 
mz1 # 阶 乘 初 始 化 为 1 
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for j in range(1, i + 1): # 内 循环 完成 i 的 计算 


Im #m 为 i 的 阶乘 
Sum+=m m 
>>> print(Sum) 
运行 结果 如 下 : 
4037913 # 运 行 结 果 


3.3.3 break 及 continue 语句 


break 语句 , 它 的 作用 是 跳出 循环 或 叫 终止 循环 , 执行 循环 后 面 的 语句 。 
continue 语句 是 结束 本 次 循环 〈 循 环 体 中 continue 后 面 的 语句 不 执行 )， 进 


入 下 一 次 循环 。 
例如 ， 循 环 条 件 为 Tue， 当 i 等 于 7 时 强制 跳出 循环 。 
>>>i=1 
>>> while True: # 循 环 条 件 永远 为 True 
ifi==7: # 判 断 变 量 i 的 值 是 否 等 于 7 
break # 如 果 变 量 i 等 于 7 就 跳出 循环 
print(i, end=" ) 
i+=1 
else: # 循 环 while 的 else 部 分 
print('yes") 
运行 结果 如 下 : 
123456 
例如 ， 把 50—80 不 能 被 3 整除 的 数 输出 。 
>>> for i in range(50, 80): # 从 50 循环 到 79 
ifi% 3 == 0: # 如 果 能 被 3 整除 就 不 输出 
continue 
print(i, end=" ") 
运行 结果 如 下 : 


50 52 53 55 56 58 59 61 62 64 65 67 68 70 7173 74 76 77 79 
3.3.4 for...if...else 循环 


在 循环 体 中 可 以 包含 另 一 个 循环 或 分 支 语 句 ， 在 分 支 语句 中 也 可 以 包 
含 另 一 个 分 支 或 循环 。 

例如 ， 将 小 写字 母 转换 成 大 写字 母 ， 大 写字 母 转换 成 小 写字 母 ， 注 意 
代码 缩 进 。 


>>> x = input(" 请 输入 字母 : ") 
请 输入 字母 : Hello world! 
>>> foriin range(len(x)): 
if (x[i] >= 'a') and (x[i] <= 'z'): 381I 2-8 23 7] E FA 
print(chr(ord(x[i]) - 32), end-") # 首 先 将 字符 转换 成 ASCII 码 进行 计 
# 算 ， 然 后 再 将 ASCIl 码 转 换 成 字符 
elif (x[i] >= 'A') and (x[i] <= 'Z'): 天 | 断 是 否 为 大 写字 母 


if x[i] =="": # 如 果 遇 到 空格 ， 原 样 输 出 
print(end-" ") 
else: #while 循环 的 else 

print(^nover!") 

运行 结果 如 下 : 

hELLO WORLD 

over! 

3.83.5 while 循环 


当 不 知道 循环 次 数 ， 但 知道 循环 条 件 时 ， 一 般 使 用 while 语句 ， 其 结构 
如 下 。 
while 循环 条 件 : 
循环 体 (语句 块 1) 
else: 
语句 块 2 
与 for 循环 类 似 ， 可 在 循环 体 中 使 用 break 和 continue 语句 ，else 部 分 
可 以 省 略 。 需 要 注意 的 是 ， 在 Python 中 没有 do..while 语句 。 
例如 ， 打 印 出 一 个 倒 三 角形 图 案 。 


ii 
>>> While i < 5: # 外 循环 0 到 4 
j=5 # 每 循环 一 次 变量 j 初始 化 为 5 
while j > i: 
print(. ', end=" ') 
je 3H 8 P 
print() 
i+=1 # 控 制 外 循环 


例如 ， 求 50 以 内 所 有 5 的 倍数 的 和 。 


>>>i=1 
>>> Sum =0 
>>> while i <= 50: # 从 1 循环 到 50 
ifi% 5 == 0: # 着 断 变 量 i 是 否 能 被 5 整除 
Sum *- i 
print(i, end=" ) 
i+=1 # 循 环 控制 变量 
else: # 循 环 正常 结束 ， 就 执行 else 部 分 
print(^nover") 
>>> print(Sum) 
运行 结果 如 下 : 
5 10 15 20 25 30 35 40 45 50 
over 
275 
3.44 实验 


3.4.1 使 用 条 件 语句 


(1) 从 键盘 输入 3 个 同学 的 成 绩 ， 然 后 找 出 最 高 分 。 


>>> st1 = float(input(" 请 输入 第 一 位 同学 的 成 绩 : ") 
请 输入 第 一 位 同学 的 成 绩 : 75 
>>> st2 = float(input(" 请 输入 第 二 位 同学 的 成 绩 : ")) 
请 输入 第 二 位 同学 的 成 绩 : 90 
>>> st3 = float(input(" 请 输入 第 三 位 同学 的 成 绩 : ")) 
请 输入 第 三 位 同学 的 成 绩 : 88 


>>> max = st1 # 假 设 第 一 个 为 最 高 分 

>>> if max < st2: # 如 果 第 一 个 数 小 于 第 十 个 数 ， 最 大 的 数 就 变 成 第 二 个 
max = st2 

>>> if max < st3: # 把 前 面 两 个 最 大 的 数 和 第 三 个 比 
max = st3 

>>> print(max) 

运行 结果 如 下 : 

90.0 


(2) 输入 3 个 同学 的 成 绩 ， 然 后 从 大 到 小 排列 。 


>>> st1 = float(input(" 请 输入 第 一 位 同学 的 成 绩 : ")) 
请 输入 第 一 位 同学 的 成 绩 : 78 
>>> st2 = float(input(" 请 输入 第 二 位 同学 的 成 绩 : ")) 
请 输入 第 二 位 同学 的 成 绩 : 66 


>>> st3 = float(input(" 请 输入 第 三 位 同学 的 成 绩 : ")) 
请 输入 第 三 位 同学 的 成 绩 : 80 
>>> if st1 < st2: # 第 一 个 和 第 二 个 进行 比较 
tmp = st1 
st1 = st2 
st2 =tmp # 交 换 两 个 数 的 值 
>>> if st1 < st3: # 第 一 个 和 第 三 个 进行 比较 
tmp = st1 
st1 = st3 
st3 = tmp 
>>> if st2 < st3: # 第 二 个 和 第 三 个 进行 比较 
tmp = st2 
st2 = st3 
st3 = tmp 
>>> print(st1, st2, st3) 


运行 结果 如 下 : 
80.0 78.0 66.0 


3.4.2 使 用 for 语 句 


CD RH 1000 以 内 的 所 有 完 数 ， 如 6=1+2+3， 除 了 它 自身 以 外 的 因子 


>>> for i in range(1, 1000): # 外 循环 从 1 到 999 
Sum=0 # 创 建 Sum 变量 作为 各 因子 之 和 
for j in range(1, i): # 内 循环 判断 这 个 数 是 不 是 完 数 
ifi96j--0: # 求 出 它 的 所 有 因数 
Sum +=j # 把 求 出 来 的 因数 相 加 
if Sum == i: # 断 它 的 因子 之 和 是 否 等 于 它 本 身 
print(i, end=" ) 
运行 结果 如 下 : 
6 28 496 


(2) 用 循环 语句 求 1+22+333+4444+55555 的 和 。 


>>> Sum=1 # 直 接 把 1 放 到 总 和 里 面 
>>> for i in range(2, 6): # 外 层 循环 运行 4 次 
x=i # 控 制 最 高 位 的 数 
for j in range(1, i+1): 
x=x*10+i 3H] 22=2*10+2， 加 的 变量 i 就 是 个 位 的 数 
Sum *- x 
>>> print("142243334...455555 的 和 为 :%d" 96 Sum) 
运行 结果 如 下 : 


1+22+333+...+55555 的 和 为 :603555 


3.4.8 ”使 用 while 语句 


CD 求 出 2000—2100 的 所 有 状 年 ， 条 件 是 能 同时 被 4 和 100 整除 ， 或 


者 能 被 400 整除 的 是 半年 。 
>>> year = 2000 
>>> While year <= 2100: # 循 环 从 2000 到 2100 
if (year % 4 == 0 and year % 100 !- 0) or (year % 400 == 0): 
天 | 断 是 否 为 闽 年 
print(year, end-' ) 
year += 1 # 人 循环 控制 变量 
运行 结果 如 下 : 


2000 2004 2008 2012 2016 2020 2024 2028 2032 2036 2040 2044 2048 2052 
2056 2060 2064 2068 2072 2076 2080 2084 2088 2092 2096 


(2) 输入 两 个 正 整 数 ， 并 求 出 它们 的 最 大 公约 数 和 最 小 公 倍 数 。 
>>> x = int(input(" 请 输入 第 一 个 数 ")) 


请 输入 第 一 个 数 12 
>>> y = int(input(" 请 输入 第 二 个 数 ")) 
请 输入 第 二 个 数 18 
>>>r=x%y # 取 两 个 数 的 余数 ， 作 为 循环 控制 变量 
>>>b=y 
>>> while r: # 等 价 于 r>0 
a=b 
b=r # 保 存 最 大 公约 数 
r=a%b # 求 两 个 数 的 最 大 公约 数 
>>> gbs = x*y/b # 了 两 个 数 相 乘 ， 再 除 以 最 大 公约 数 就 是 最 大 公 倍 数 
>>> print(" 最 大 公约 数 为 : %d\n 最 小 公 倍数 为 : od" 96 (b,gbs)) 
运行 结果 如 下 : 
最 大 公约 数 为 : 6 


最 小 公 倍数 为 : 36 
3.4.4 使 用 break 语句 


COD 输出 100 以 内 的 所 有 质数 。 


>>> for i in range(2, 100): 
x=1 # 每 次 初始 化 为 1， 默 认 是 质数 
for j in range(2, i): # 队 层 循环 判断 是 否 为 质数 
ifi%j== 0: # 判 断 i 是 否 能 被 j 整除 
x=0 
break # 跳 出 内 层 循环 
if x: # 等 价 于 x==1 或 xl=0 
print(i, end- ' ") 


运行 结果 如 下 : 
2357 11 13 17 19 23 29 31 37 41 43 47 53 59 61 67 71 73 79 83 89 97 
(2) SR 100 以 内 最 大 的 10 个 质数 的 和 。 


>>> į = 100 
>>> sum =p=0 # 变 量 sum RM, LE p 记录 个 数 
>>> Whilei> 0: 
x=1 # 每 次 初始 化 为 1， 默 认 是 质数 
forjinrange(2,i) — # 队 层 循环 判断 是 否 为 质数 
ifi % j == 0: # 判 断 i 是 否 能 被 ] 整除 
x=0 
break # 跳 出 内 层 循环 
if x: # 等 价 于 x==1 或 x!=0 
ifp < 10: # 控 制 输出 的 个 数 
print(i, end=" " 
sum*-i ”# 求 和 
p+=1 
else: 
break 


i--1 
运行 上 面 的 语句 输出 如 下 : 
97 89 83 79 73 71 67 61 59 53 
再 执行 print 函数 打印 结果 : 
>>> print(\n100 内 最 大 的 10 个 质数 和 为 : %d'%sum) 
运行 结果 如 下 : 
100 内 最 大 的 10 个 质数 和 为 : 732 


3.4.5 ”使 用 continue 语句 


CD 求 1 一 10 的 所 有 偶数 的 和 。 


>>> sum =0 # 创 建 sum 变量 作为 和 
>>> for i in range(1, 11): # 从 1 循环 到 10 
ifi% 24= 0: # 如 果 是 偶数 就 不 输出 ， 也 不 做 计算 
continue 
print(i, end=" ") 
sum +=i 
运行 上 面 的 语句 输出 如 下 : 
246810 # 运 行 结果 
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再 执行 print 函数 打印 结果 : 

>>> print(\n10 以 内 的 偶数 和 为 : %d' 96 sum) 

运行 结果 如 下 : 

10 以 内 的 偶数 和 为 : 30 

(2) 将 10—20 不 能 被 2 或 3 整除 的 数 输出 。 

>>> for i in range(10, 20): # 从 10 循环 到 19 
ifi% 2 == 0 ori % 3 == 0: 判断 是 否 能 被 2 或 3 整除 ， 是 就 不 输出 

continue 

print(i, end=" ) 

运行 结果 如 下 : 

11131719 


3.5 小结 


本 章 讲解 了 Python 的 流程 控制 : 让 分 支 、for 循环 和 while 循环 。if、 for 
和 while 的 语法 很 简单 ， 但 通过 组 合 或 嵌 套 ， 可 以 实现 各 种 简单 到 复杂 的 程 
序 罗 辑 结构 。 

为 了 保证 程序 流程 控制 的 灵活 性 , Python 提供 了 continue 和 break 两 个 
语句 来 控制 循环 语句 。continue 语句 用 来 结束 本 次 循环 ， 提 前 进入 下 一 次 循 
XR. break 语句 用 于 强制 退出 循环 ， 不 执行 循环 体 中 剩余 的 循环 次 数 。 


习题 
一 、 选 择 题 
l. 下 列 选项 中 语法 正确 的 是 〈 )。 
A. if 1: B. if True C. while 2 D. for i in(12.3.4) 
break continue break continue 
2. 下 列 选 项 中 ， 布 尔 值 不 是 False 的 是 Jo 
A. 0 B. -1 €. n D. None 
3. 在 Python 中， 下 列 流程 控制 语句 没有 的 是 )。 
A. if.elf B. while...else C. do..while D. if..else 
4. 在 循环 中 可 以 使 用 ( ) 语句 跳出 循环 。 
A. Break B. Continue C. break D. continue 
5. 在 forirange(5) 语 句 中 ，i 的 取 值 是 〈 p» 
A. [0123.45]. B. [12.3.4] C. [L23.45] D. [1.23.4] 


à 


Hin 


n 


控制 


—— $38 i 
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二 、 填 空 题 
LL 语句 是 else 和 站 的 组 合 。 
2 不 能 单独 和 半分 支配 合 使 用 。 


3. 每 个 流程 结构 语句 后 面 必须 要 有 ____。 

4. Python 中 的 流程 控制 语句 有 和 

S. 当 循 环 — 结束 时 才 会 执行 else 部 分 。 

三 、 编 程 题 

1. 输入 一 行 字 符 ， 统 计 字 母 、 数 字 、 空 格 和 其 他 字符 个 数 。 
2. 将 一 个 正 整数 分 解 质 因数 。 例 如 ， 输 入 60， 打 印 出 60=2*2*3*5。 
3. 打印 以 下 图 形 

ABCDEFG 

GABCDEF 

FGABCDE 

EFGABCD 

DEFGABC 

CDEFGAB 

BCDEFGA 
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组 合 数据 类 型 


Python 中 常用 的 组 合 数据 类 型 有 列表 、 元 组 、 字 典 和 集合 等 ， 其 中 列 
表 和 元 组 属于 序列 类 型 (Sequences)， 字 典 属 于 映射 类 型 (Mappings)， 集 
合 属于 集合 类 型 (Set types). 

本 章 对 列表 、 元 组 、 字 典 和 集合 4 种 数据 类 型 进行 介绍 ， 主 要 有 这 4 
种 数据 类 型 的 概念 、 使 用 方法 ， 以 及 它们 的 相同 点 和 不 同 点 ， 并 能 利用 它 
们 编写 简单 的 程序 。 
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列表 (Lists) 属于 Python 中 的 序列 类 型 ， 它 是 任意 对 象 的 有 序 集合 ， 
通过 “位 置 ”或 者 “索引 ”访问 其 中 的 元 素 ， 它 具有 可 变 对 象 、 可 变 长 度 、 
异 构 和 任意 嵌 套 的 特点 。 


4.1.1 创建 列表 


列表 中 第 一 个 元 素 的 “位 置 ” 或 者 “索引 ”是 从 “0” 开 始 ， 第 二 个 元 
素 的 “位 置 ”或 “索引 ” 则 是 从 “1” 开 始 ， 以 此 类 推 。 

在 创建 列表 时 ， 列 表 元 素 放置 在 方 括号 [] 中 ， 以 逗号 来 分 隔 各 元 素 ， 
格式 如 下 : 


listname = [元 素 1, 元 素 2, 元 素 3, .…, zc n] 


举例 如 下 : 
sample_list1 = [0, 1, 2, 3, 4] 


sample list2 = ["P", "y", "t", "h", "o", "n"] 
sample list3 = ['Python', 'sample', 'list', for, 'your', 'reference'] 


代码 运行 如 下 : 
>>> sample list1 = [0, 1, 2, 3, 4] # 列 表 sample list1 
>>> sample_list2 = ["P", "y", "t", "h", "o", "n"] £z sample list2 
>>> sample list3 = ['Python', 'sample', 'list', for', 

'your', 'reference"] # 列 表 sample list3 
>>> print (sample_list1) 3HTEDAé HH PUE 
[0, 1, 2, 3, 4] # 输 出 结果 
>>> print (sample_list2) 圭 J 印 输出 列表 
[py "t, "h', 'o', n] # 输 出 结果 
>>> print (sample_list3) 圭 J 印 输出 列表 


[Python', 'sample', 'list', for, 'your', reference'] 286i £5 5 

列表 中 允许 有 不 同 数据 类 型 的 元 素 ， 例 如 : 

sample list4 = [0, "y", 2, "h", 4, "n", 'Python'] 

但 通常 建议 列表 中 元 素 最 好 使 用 相同 的 数据 类 型 。 

JRT AREE, Ai: 

sample list5 = [sample list1, sample list2, sample_list3] 

运行 结果 如 下 : 

>>> sample list1 = [0, 1, 2, 3, 4] 

>>> sample list2 = ["P" "y", "t", "h", "o", "n"] 

>>> sample list3 = ['Python', 'sample', 'list', 'for', 'your', reference'] 
>>> sample list5 = [sample list, sample list2, sample list3]4613& —4- 8-5 
表 

>>> print (sample list5) 


[[O, 1, 2, 3, 4], [P', Y, t, "h', 'o', "n, ['Python', 'sample', "list', 'for', 'your, 
'reference']] 


4.1.2 ”使 用 列表 


可 以 通过 使 用 “位 置 ”或 者 “索引 ”来 访问 列表 中 的 值 ， 将 其 放 在 方 
括号 中 。 特 别 注意 ,“ 位 置 ”或 者 “索引 ”是 从 0 开始 ， 例 如 引用 4.1.1 节 
列表 示例 sample listl 中 的 第 1 个 ， 可 以 写成 “sample list1[0]"; 引用 第 3 
个 值 ， 可 以 写成 “sample list1[2]”。 代 码 示例 如 下 : 

>>> Sample_list1 = [0, 1, 2, 3, 4] 

>>> print ("sample_list1[0]: " sample_list1[0]) # 输 出 索引 为 0 的 元 素 

sample_list1[0]: 0 

>>> print ("sample_list1[2]: " sample_list1[2]) “着 偷 出 索引 为 2 的 元 素 

sample list1[2]: 2 
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可 以 在 方 括号 中 使 用 “ 负 整数 ” 如 sample listl[-2]， 意 为 从 列表 的 右 
侧 开始 倒数 2 个 的 元 素 ， 即 索引 倒数 第 2 的 元 素 。 

>>> sample list1 = [0, 1, 2, 3, 4] 

>>> print ("sample list1[-2]: ", sample_list1[-2])# 输 出 索引 倒数 第 2 的 元 素 

sample list1[-2]: 3 

可 以 在 方 括号 中 用 冒号 分 开 的 两 个 整数 来 截取 列表 中 的 元 素 ， 例 如 
sample jlist2[2:4]， 可 取得 列表 sample list2 中 的 第 3 个 和 第 4 个 元 素 , 不 包 
含 第 5 个 元 素 。 

>>> sample list2 = ["p", "y", "t", "h", "o", "n"] 

>>> print ("sample list2[2:4]:", sample list2[2:4]) 

sample list2[2:4]: ['t', 'h'] 

该 类 操作 被 称 为 “切片 ”操作 (slice)。 

对 列表 的 元 素 进行 修改 时 ， 可 以 使 用 赋值 语句 : 


>>> sample list3 = ['python', 'sample', 'list', for, 'your', 'reference'] 
>>> sample list3[4] = 'my' 

>>> print ("sample list3[4];[", sample list3[4]) 

sample list3[4]: my 

>>> print ("sample list3:", sample list3) 

sample list3: ['python', 'sample', 'list', 'for', 'my', reference'] 


4.1.3 ”删除 列表 元 素 


删除 列表 的 元 素 ， 可 以 使 用 del 语句 ， 格 式 如 下 : 

del listname[ 索 引 ] 

该 索引 的 元 素 被 删除 后 ， 后 面 的 元 素 将 会 自动 移动 并 填补 该 位 置 。 

在 不 知道 或 不 关心 元 素 的 索引 时 ， 可 以 使 用 列表 内 置 方法 remove() 来 
删除 指定 的 值 ， 例 如 : 

listname.remove(' 值 ) 

清空 列表 ， 可 以 采用 重新 创建 一 个 与 原 列表 名 相同 的 空 列表 的 方法 ， 
例如 : 

listname = [] 

删除 整个 列表 ， 也 可 以 使 用 del 语句 ， 格 式 如 下 : 

del listname 

代码 示例 如 下 : 

>>> sample list4 = [0, "y", 2, "h", 4, "n", 'Python'] 


>>> del sample list4[5] SHBIBS SUE RS [73 5 的 元 素 
>>> print ("after deletion, sample list4: ", sample list4) 

after deletion, sample list4:  [O, 'y', 2, 'h', 4, 'Python'] 

>>> sample list4.remove('Python') # 删 除 列表 中 值 为 Python 的 元 素 
>>> print ("after removing, sample list4: ", sample list4) 

after removing, sample list4:  [O, 'y', 2, 'h', 4] 


>>> sample list4 = [] # 重 新 创建 列表 并 置 为 空 
>>> print (sample_list4) # 输 出 该 列表 

0 

>>> del sample list4 # 删 除 整 个 列表 

>>> print (sample_list4) # 打 印 输出 整个 列表 


Traceback (most recent call last): 
File "<pyshell#108>", line 1, in <module> 
print (sample list4) 
NameError: name 'sample list4' is not defined # 系 统 报告 该 列表 未 定义 


4.1.4 ”列表 的 内 置 函 数 与 其 他 方法 


列表 的 内 置 函 数 有 len, max, min 和 list 等 ， 如 表 4.1 所 示 。 
表 4.1 列表 的 内 置 函数 


返回 列表 的 元 素数 量 


返回 列表 中 元 素 的 最 大 值 
返回 列表 中 元 素 的 最 小 值 


将 元 组 转换 为 列表 
代码 示例 如 下 : 
>>> sample_list1 = [0, 1, 2, 3, 4] 
>>> len(sample list1) # 列 表 的 元 素数 量 
5 
>>> max(sample list1) # 列 表 中 元 素 的 最 大 值 
4 
>>> min(sample list1) R PTRS MA 
0 
需要 注意 的 是 ，Python 3 中 已 经 没有 了 Python 2 中 用 于 列表 比较 的 

cmp 函数 。 


另外 ， 列 表 还 有 方法 ， 如 表 4.2 所 示 。 


R42 列表 的 其 他 方法 
说 明 
在 列表 末尾 添加 新 的 元 素 
统计 该 元 素 在 列表 中 出 现 的 次 数 


listname.append( 元 素 ) 


listname.count( 元 素 ) 
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追加 另 一 个 序列 类 型 中 的 多 个 值 到 该 列表 末 


scan 尾 〈 用 新 列表 扩展 原来 的 列表 ) 
续 表 
方法 说 明 
listuame index CK) JACI HUBE d QUB — HERO ESSI 
位 置 
listname.insert( 位 置 ， 元 素 ) 将 元 素 插 入 列表 
移 除 列表 中 的 一 个 元 素 (“-1” 表 示 从 右 侧 
listname.pop([index=-1]) 数 第 一 个 元 素 ， 也 就 是 最 后 一 个 索引 的 元 
素 ) ， 并 且 返 回 该 元 素 的 值 
listname.remove( 元 素 ) 移 除 列表 中 第 一 个 匹配 某 个 值 的 元 素 
listname.reverse() 将 列表 中 的 元 素 反 向 
listname.sort(cmp=None, key=None, 对 列表 进行 排序 
reverse=False) 
listname.clea 清空 列表 
listname.cop 复制 列表 
4.2 元 组 


元 组 (Tuple) 与 列表 一 样 ， 属 于 Python 中 的 序列 类 型 ， 它 是 任意 对 象 
的 有 序 集合 ， 通 过 “位 置 ”或 者 “索引 ”访问 其 中 的 元 素 ， 它 具有 可 变 长 
度 、 异 构 和 任意 嵌 套 的 特点 ， 与 列表 不 同 的 是 ， 元 组 中 的 元 素 是 不 可 修改 
的 。 


4.2.1 创建 元 组 


元 组 的 创建 很 简单 ， 把 元 素 放 入 小 括号 ， 并 在 每 两 个 元 素 中 间 使 用 逗 
号 隔 开 即 可 ， 格 式 如 下 : 

tuplename = (元 素 1, 元 素 2, 元 素 3, .…, zt n) 

举例 如 下 : 

sample_tuple1 = (1, 2, 3, 4, 5, 6) 

sample tuple2 = "p", "y", "t", "h", "o", "n" 

sample tuple3 = ('python', 'sample', 'tuple', 'for', 'your', 'reference') 

sample tuple4 - ('python', 'sample', 'tuple', 1989, 1991, 2018) 

元 组 中 的 元 素 可 以 是 各 种 可 迭代 的 数据 类 型 。 

元 组 也 可 以 为 空 : 

sample tuple5 - () 


需要 注意 的 是 ， 为 避免 歧义 ， 当 元 组 中 只 有 一 个 元 素 时 ， 必 须 在 该 元 


素 后 加 上 逗号 ， 否 则 括号 会 被 当 作 运算 符 ， 例 如 : 
sample tuple6 = (123,) 
元 组 也 可 以 嵌 套 使 用 ， 例 如 : 


sample tuple7 = (sample tuple1, sample tuple2) 
>>> sample tuple1 = (1, 2, 3, 4, 5, 6) 


>>> sample tuple7 = (sample tuple1, sample tuple2) 
>>> print (sample tuple7) 
((1, 2, 3, 4, 5, 6), (P, 'y', "t^, "h', "o"; n) 


4.2.2 ”使 用 元 组 


与 列表 相同 ， 我 们 可 以 通过 使 用 “位 置 ”或 者 “索引 ”来 访问 元 组 中 
的 值 ,“ 位 置 ”或 者 “索引 ”也 是 从 0 开始 ， 例 如 : 

sample tuple1 = (1, 2, 3, 4, 5, 6) 

sample_tuplel[1] 表 示 元 组 tuplel 中 的 第 2 个 元 素 : 2. 

sample_tuplel[3:5] 表 示 元 组 sample tuplel 中 的 第 4 个 和 第 5 个 元 素 ， 
不 包含 第 6 个 元 素 : 4,5。 

sample_tuplel[-2] 表 示 元 组 sample tuplel 中 从 右 侧 向 左 数 的 第 2 个 元 
Xi» 


代码 示例 如 下 : 

>>> sample_tuple1 = (1, 2, 3, 4, 5, 6) 

>>> print (sample_tuple1[1]) # 截 取 第 2 个 元 素 

2 

>>> print (sample_tuple1[3:5]) # 第 4 个 和 第 5 个 元 素 ， 不 包含 第 6 个 元 素 
(4, 5) 


>>> print (sample tuple1[-2]) # 从 右 侧 向 左 数 的 第 2 个 元 素 

5 

元 组 也 支持 “切片 ”操作 ， 例 如 : 

sample tuple2 = "P", "y", "t", "h", "o", "n" 

sample tuple2[:] 表示 取 元 组 sample tuple2 的 所 有 元 素 。 

sample tuple2[3:] 表示 取 元 组 sample tuple2 的 索引 为 3 的 元 素 之 后 的 
所 有 元 素 。 

sample tuple2[0:4:2] 表示 元 组 sample_tuple2 的 索引 为 0 一 4 的 元 素 ,每 
隔 一 个 元 素 取 一 个 。 

代码 示例 如 下 : 


>>> sample tuple2 = "P", "y", "t", "h", "o", "n" 


>>> print (sample tuple2[:]) # 取 元 组 sample_tuple2 的 所 有 元 素 
CP y, t, 'h', 'o', 'n') 

>>> print (sample tuple2[3:]) # 取 元 组 的 第 4 个 元 素 之 后 的 所 有 元 素 
Ch', 'o', my) 


>>> print (sample tuple2[0:4:2]) 
# 元 组 sample_tuple2 的 第 1 个 到 第 5 个 元 素 ， 每 隔 一 个 元 素 取 一 个 
(P* t) 


4.2.3. ”删除 元 组 


由 于 元 组 中 的 元 素 是 不 可 变 的 ， 也 就 是 不 允许 被 删除 的 ， 但 可 以 使 用 
del 语句 删除 整个 元 组 : 


del tuple 

代码 示例 如 下 : 

>>> sample tuple3 = ('Python', 'sample', 'tuple', 'for', 'your', 'reference") 
>>> print (sample. tuple3) # 输 出 删除 前 的 元 组 sample tuple3 
('Python', 'sample', 'tuple', 'for', 'your', 'reference") 

>>> del sample tuple3 # 删 除 元 组 sample tuple3 

>>> print (sample_tuple3) # 输 出 删除 后 的 元 组 sample tuple3 


Traceback (most recent call last): 
File "<pyshell#49>", line 1, in <module> 
print (sample tuple3) 
NameError: name ' sample tuple3' is not defined 
# 系 统 正常 报告 sample_tuple3 没有 定义 


4.2.4 ”元 组 的 内 置 函数 


元 组 的 内 置 函数 有 len, max, min, tuple 等 ， 其 用 法 和 说 明 如 表 4.3 
所 示 。 


R43 元 组 的 内 置 函数 


函数 说 明 
len(tuplename) 返回 元 组 的 元 素数 量 
max(tuplename 返回 元 组 中 元 素 的 最 大 值 
min(tuplename) 返回 元 组 中 元 素 的 最 小 值 
tuple(listname) 将 列表 转换 为 元 组 

代码 示例 如 下 : 

>>> sample_tuple1 = (1, 2, 3,4,5,6)  # 创 建 元 组 tuple1 
>>> print (len(sample tuple1)) # 输 出 元 组 长 度 

6 


>>> print (max(sample_tuple1)) # 输 出 元 组 最 大 值 


6 
>>> print (min(sample tuple1)) # 输 出 元 组 最 小 值 
1 
>>> a = [1,2,3] # 创 建 列表 a 
>>> print (a) 3H PIE a 
[1,2,3] 
>>> print (tuple(a)) # 转 换 列表 a 为 元 组 后 输出 
(1,2,3) 
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字典 (Dictionaries)， 属 于 映射 类 型 ， 它 是 通过 键 实现 元 素 存 取 ， 具 有 
无 序 、 可 变 长 度 、 异 构 、 榜 套 和 可 变 类 型 容器 等 特点 。 
4.3.1 创建 字典 

字典 中 的 键 和 值 有 单 引号 ， 他 们 成 对 出 现 ， 中 间 用 冒号 分 隔 ， 每 对 直 
接 用 逗号 分 隔 ， 并 放置 在 花 括 号 中 ， 格 式 如 下 : 

dictname = {§Ẹ 1: (& 1, 882: 1 2, #3: 值 3,..., Si& n: 值 n} 

在 同一 个 字典 中 ， 键 应 该 是 唯一 的 ， 但 值 则 无 此 限制 。 

举例 如 下 : 


sample_dict1 = ('Hello': 'World', 'Capital': 'BJ', 'City': 'CQ") 
sample_dict2 = {12: 34, 34: 56, 56: 78} 
sample dict3 = ('Hello': 'World', 34: 56, 'City': 'CQ') 


如 果 创 建 字典 时 ， 同 一 个 键 被 两 次 赋值 ， 那 么 第 一 个 值 无 效 ， 第 二 个 
值 被 认为 是 该 键 的 值 。 

sample dict4 = {Model': 'PC', 'Brand': 'Lenovo', 'Brand': 'Thinkpad') 

这 里 的 键 Brand 生效 的 值 是 Thinkpad。 

字典 也 支持 嵌 套 ， 格 式 如 下 : 


dictname = (82 1: (8 11: 值 11, 键 12: 值 12), 
$22: 8 21: (8 21, 8 2: 18 22), 


$& n: (S& n1: f& n1, i£ n2: (& n2} 
例如 : 


sample dict5 = ('office':( 'room1":'Finance ', 'room2":'logistics’}, 
"lab':(lab1'"Physics', 'lab2':'Chemistry'}} 


4.3.2 ”使 用 字典 


使 用 字典 中 的 值 时 ， 只 需要 把 对 应 的 键 放 入 方 括号 ， 格 式 如 下 : 
dictname[ 键 ] 


举例 如 下 : 


>>> sample dict1 = ('Hello': 'World', 'Capital': 'BJ', 'City': 'CQ'} 

>>> print ("sample dict1['Hello: ", sample dict1['Hello']) 

sample dicti[Hello]: World 361158273 Hello 的 值 

>>> sample dict2 = (12: 34, 34: 56, 56: 78) 

>>> print ("sample dict2[12]: ", sample dict2[12]) 

sample dict2[12]: 34 38818873 12 的 值 
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>>> sample dict5 = ('office':( 'room1""Finance', 'room2"''logistics"), 
'lab':lab1** Physics', 'lab2"'Chemistry']) 

>>> print ("sample dict5['office']: ", sample dict5['office']) 


sample dict5['office]: (room1' 'Finance', 'room2": 'logistics") 
3881118273 office 的 值 


可 以 对 字典 中 已 有 的 值 进行 修改 ， 例 如 : 
>>> sample dict! =fHello: 'World', 'Capital': 'BJ', 'City': 'CQ'} 


>>> print (sample dict1['City']) 者 输出 键 为 City 的 值 

CQ 

>>> sample dict1['City'] = 'NJ' 3808273 City 的 值 修改 为 NJ 
>>> print (sample dict1['City']) 38611573 City 的 值 

NJ 


>>> print (sample dict1) 
(Hello': 'World', 'Capital': 'BJ', 'City': 'NJ') # 输 出 修改 后 的 字典 


可 以 向 字典 末尾 追加 新 的 键 值 ， 例 如 : 

>>> sample dict1 = ('Hello': 'World', 'Capital': 'BJ', 'City': 'CQ'} 

>>> sample dict1[viewspot]- 'HongYaDong' # 把 新 的 键 和 值 添加 到 字典 
>>> print (sample_dict1) # 输 出 修改 后 的 字典 
{Hello': 'World', 'Capital': 'BJ', 'City': 'CQ', 'viewspot': 'HongYaDong'} 


4.3.3 ”删除 元 素 和 字典 
可 以 使 用 del 语句 删除 字典 中 的 键 和 对 应 的 值 ， 格 式 如 下 : 
del dictname[ 键 ] 
使 用 del 语句 删除 字典 ， 格 式 如 下 : 
del dictname 


举例 如 下 : 
>>> sample_dict1 = ('Hello': 'World', 'Capital': 'BJ', 'City': 'CQ'} 


>>> del sample dict1[City] # 删 除 字典 中 的 键 City 和 对 应 的 值 


>>> print (sample_dict1) SHTEDZSSR. 
{Hello': 'World', 'Capital': 'BJ') 

>>> del sample dict # 删 除 该 字典 
>>> print (sample_dict1) 持 J 印 该 字典 


Traceback (most recent call last): 。” # 系 统 正常 报错 ， 该 字典 未 定义 
File "<pyshell#71>", line 1, in <module> 
print (sample dict1) 
NameError: name 'sample dict1' is not defined 


4.3.4 字典 的 内 置 函 数 和 方法 


字典 的 内 置 函数 有 len、str、type， 如 表 4.4 所 示 。 
表 4.4 字典 的 内 置 函 数 


计算 键 的 总 数 
输出 字典 
返回 字典 类 型 
举例 如 下 : 
>>> sample dict1 = ('Hello': 'World', 'Capital': 'BJ', 'City': 'CQ'} 
>>> len(sample dict1) # 计 算 该 字典 中 键 的 总 数 
3 
>>> str(sample_dict1) # 输 出 字典 
"('Hello': "World', 'Capital': 'BJ', 'City': 'CQ'}" 
>>> type(sample, dict1) # 返 回 数据 类 型 
«class "dict> 


字典 还 有 多 种 方法 ， 如 表 4.5 所 示 ， 其 中 dictname 为 字典 名 。 
表 4.5 字典 的 其 他 方法 


方法 说 明 


dictname.clear() 删除 字典 所 有 元 素 ， 清 空 字典 


以 字典 类 型 返回 某 个 字典 的 浅 复制 
创建 一 个 新 字典 ， 以 序列 中 的 元 素 做 字典 的 键 ， 值 
为 字典 所 有 键 对 应 的 初始 值 


dictname.coj 


dictname.fromkeys(seq[.value]) 


dictname.get(value.default- 
None) 


返回 指定 键 的 值 ， 如 果 值 不 在 字典 中 返回 default 值 


如 果 键 在 字典 dict 中 返回 True, AWK El False 
以 列表 返回 可 遍历 的 〈 键 ， 值 ) 元 组 数组 


key in dictname 


dictname.items() 


dictname.keys() 将 一 个 字典 所 有 的 键 生成 列表 并 返回 
dictname.setdefault(value, 和 dictname.get0 类 似 ， 不 同 点 是 ， 如 果 键 不 存在 于 
default-None 字典 中 ， 将 会 添加 键 并 将 值 设 为 default 对 应 的 值 


dictname update( dictname2) | 把 字典 dictname2 的 键 / 值 对 更 新 到 dictname 中 


续 表 
方法 说 明 
dictname.values() 以 列表 返回 字典 中 的 所 有 值 


弹出 字典 给 定 键 所 对 应 的 值 ， 返 回 值 为 被 删除 的 值 。 
键 值 必须 给 出 否则， 返回 default (fi 

弹出 字典 中 的 一 对 键 和 值 〈 一 般 删除 末尾 对 ) ， 并 
删除 


dictname.pop(key[.default]) 


dictname.popitem() 


44 集合 


集合 (set)， 是 一 种 集合 类 型 ， 可 以 理解 为 就 是 数学 课 里 学 习 的 集合 。 
它 是 一 个 可 以 表示 任意 元 素 的 集合 ， 它 的 索引 可 以 通过 另 一 个 任意 键 值 的 
集合 进行 ， 它 可 以 无 序 排列 和 哈 希 。 

集合 分 为 可 变 集合 Cet) 和 不 可 变 集 合 〈frozenset) 两 类 。 

可 变 集合 在 被 创建 后 ， 可 以 通过 很 多 种 方法 被 改变 ， 例 如 add()、 
update() 等 。 

不 可 变 集合 由 于 其 不 可 变 特性 ， 它 是 可 哈 希 的 (hashable， 意 为 一 个 对 
象 在 其 生命 周期 中 ， 其 哈 希 值 不 会 改变 ， 并 可 以 和 其 他 对 象 做 比较 )， 也 可 
以 作为 一 个 元 素 被 其 他 集合 使 用 ， 或 者 作为 字典 的 键 。 


44.1 创建 集合 


使 用 大 括号 () 或 者 set0 创 建 非 空 集合 ， 格 式 如 下 : 
sample set = (f& 1, 值 2, 1&3, ..., 值 n} 

或 

sample set = set([ 值 1, 值 2, 值 3, ..., 值 m) 


创建 一 个 不 可 变 集合 ， 格 式 如 下 : 
sample set = frozenset([ 值 1, 值 2, 值 3, ..., f&n]) 


举例 如 下 : 

sample_set1 = {1, 2, 3, 4, 5} 

sample_set2 = ('a', 'b', 'c', 'd', 'e'} 

sample set3 = {'Beijing', 'Tianjin', Shanghai', 'Nanjing', "Chongqing" 
sample set4 - set([11, 22, 33, 44, 55]) 

sample set5 = frozenset['CHS', 'ENG', ",","]) 。 # 创 建 不 可 变 集合 


但 创建 空 集合 时 必须 使 用 set0， 格 式 如 下 : 
emptyset = set() 


44.2 ”使 用 集合 


集合 的 一 个 显著 的 特点 就 是 可 以 去 掉 重 复 的 元 素 ， 例 如 : 

>>> sample set6 = (1, 2, 3, 4, 5, 1,2, 3, 4) 

>>> print (sample. set6) # 输 出 去 掉 重 复 的 元 素 的 集合 
{1, 2, 3, 4, 5} 

可 以 使 用 len0 函 数 来 获得 集合 中 元 素 的 数量 ， 例 如 : 


>>> sample set6 = {1, 2, 3, 4, 5, 1,2, 3, 4) 

>>> len(sample set6) # 输 出 集合 的 元 素数 量 

5 

需要 注意 的 是 ， 这 里 集合 的 元 素数 量 ， 是 去 掉 重 复元 素 之 后 的 数量 。 

合 是 无 序 的 ， 因 此 没有 “索引 ”或 者 “ 键 ”来 指定 调用 某 个 元 素 ， 

但 可 以 使 用 for 循环 输出 集合 的 元 素 ， 例 如 : 

>>> sample set6 = {1, 2, 3, 4, 5, 1, 2, 3, 4,} 

>>> for x in sample set6: 

print (x) 


需要 注意 的 是 ， 这 里 输出 的 集合 的 元 素 ， 也 是 去 掉 重 复元 素 之 后 的 。 
向 集合 中 添加 一 个 元 素 ， 可 以 使 用 add0 方 法 ， 即 把 需要 添加 的 内 容 作 
为 一 个 元 素 〈 整 体 )， 加 入 集合 中 ， 格 式 如 下 : 

setname.add( 元 素 ) 

向 集合 中 添加 多 个 元 素 ， 可 以 使 用 update() 方 法 ， 将 另 一 个 类 型 中 的 元 
素 拆 分 后 ， 添 加 到 原 集合 中 ， 格 式 如 下 : 


setname.update(others) 
上 述 两 种 增加 集合 元 素 的 方法 ， 对 可 变 集合 有 效 ， 例 如 : 


>>> sample_set1 = {1, 2, 3, 4, 5} 
>>> sample_set1.add(6) # 使 用 add() 方 法 添加 元 素 到 集合 
>>> print ("after being added, the set is: ", sample_set1) 


after being added, the setis: (1,2, 3, 4, 5, 6) 

>>> sample. set1.update('python') # 使 用 update() 方 法 添加 另 一 个 集合 

>>> print ("after being updated, the set is:", sample set1) 

after being updated, the set is: ('y', 1, 2, 3, 4, 5, 6, 'p', t", 'n', 'o', 'h', } 

集合 可 以 被 用 来 做 成 员 测试 ， 使 用 in 或 not in 检查 某 个 元 素 是 否 属于 
某 个 集合 ， 例 如 : 

>>> sample_set1 = (1, 2, 3, 4, 5) 

>>> sample set2 = ('a', 'b', 'c', 'd', 'e') 


>>> 3 in sample seti 3B 3 是 否 在 集合 中 ， 是 则 返回 True 
True 
>>> 'c' not in sample set2 HHE c 没有 在 集合 中 ” 
False # 如 果 c 在 该 集合 中 ， 返 回 False 
# 否 则 返回 True 


合 之 间 可 以 做 集合 运算 ， 求 差 集 (difference), JFR (union)、 交 集 

(intersection)、 对 称 差 集 symmetric difference). 

>>> sample_set7 = {'C', 'D', 'E', 'F', 'G'} 

>>> sample_set8 = ('E', 'F', 'G', 'A', 'B'} 

>>> sample_set7 - sample_set8 ##$ 

fD','c 

>>> sample set7 | sample set8  # 并 集 

TA: G B PE D-O} 

>>> sample_set7 & sample set8 #3% 

E OEF 

>>> sample_set7 ^sample_set8  ”# 对 称 差 集 

{A', 'B', 'D', 'C'} 


4.4.3 ”删除 元 素 和 集合 
可 以 使 用 remove0 方 法 删除 集合 中 的 元 素 ， 格 式 如 下 : 


setname.remove( 元 素 ) 


n| 


可 使 用 del 方法 删除 集合 ， 格 式 如 下 : 

del setname 

举例 如 下 : 

>>> sample set1 = (1, 2, 3, 4, 5) 

>>> sample set1.remove(1) # 使 用 remove() 方 法 删除 元 素 
>>> print (sample set1) 

(2,3,4,5) 

>>> sample set1.clear() 

>>> print (sample set1) 区 青空 集合 中 的 元 素 
set() # 返 回 结果 为 空 的 集合 
>>> del sample_set1 BIER SES 


>>> print (sample set1) 


Traceback (most recent call last): — # 系 统 报告 ， 该 集合 未 定义 
File "«pyshell64-", line 1, in «module» 
print (sample set1) 
NameError: name 'sample set1' is not defined 


44.4 ”集合 的 方法 


可 变 集合 与 不 可 变 集合 都 具有 以 下 方法 ， 如 表 4.6 所 示 ， 其 中 ss 为 集 
合 的 名 称 。 


表 4.6 集合 的 内 置 方法 


方法 说 明 
len(ss 返回 集合 的 元 素 个 数 
Xin ss 测试 x 是 否 是 集合 ss 中 的 元 素 , 返回 True 或 False 
x not in ss TUR x 不 在 集合 ss tH, RE True, AURE False 


当 集合 ss 与 另 一 集合 otherset 不 相交 时 ,返回 True, 
否则 返回 False 
ss.issubset(otherset) 或 如 果 集 合 ss 是 另 一 集合 otherset 的 子 集 , 返 回 True, 
ss <= otherset 否则 返回 False 
如 果 集 合 ss 是 另 一 集合 otherset 的 真子 集 ， 返 回 
Te， 否则 返回 False 


ss.isdisjoint(otherset) 


ss « otherset 


ss.issuperset(otherset) 或 如 果 集 合 ss 是 另 一 集合 otherset 的 父 集 , 返回 True, 
ss >= otherset 否则 返回 False 


如 果 集 合 ss 是 另 一 集合 otherset 的 父 集 , H. otherset 
是 ss 的 子 集 ， 则 返回 True, FUE False 


ss > otherset 


ss.union(*othersets) 或 返回 ss 和 othersets 的 并 集 ， 包 含 set 和 othersets 
ss | othersetl | otherset2 ... 的 所 有 元 素 

ss intersection(*othersets) SK, 返回 ss 和 othersets 的 交集 ， 包 含 在 ss 并 且 也 在 
ss & othersetl & otherset2 ... othersets 中 的 元 素 

ss.difference(*othersets) 或 返回 ss 与 othersets 的 差 集 ， 只 包含 在 ss 中 但 不 在 
ss - otherset] - otherset2 ... othersets 中 的 元 素 


返回 ss 与 otherset 的 对 称 差 集 ， 只 包含 在 ss 中 但 
不 在 othersets 中 ， 和 不 在 ss 中 但 在 othersets 中 的 
元 素 


ss.symmetric difference(otherset) 


或 set ^ otherset 


ss.copy() 返回 集合 ss HRH I 
可 变 集合 有 以 下 特有 的 方法 ， 如 表 AS 所 示 ， 其 中 ss 为 集合 的 名 称 。 
表 4.7 可 变 集合 的 其 他 方法 


方法 说 明 
ss.update(*othersets) 或 将 另外 的 一 个 集合 或 多 个 集合 元 素 添 加 到 集合 


ss |= othersetl | otherset2 ... ss 中 


Ss.intersection update(*othersets) 或 | 在 ss 中 保留 它 与 其 他 集合 的 交集 


set &- othersetl & otherset2 


ss.difference update(*othersets) 或 


ss -= othersetl | otherset2 ... 


ss.symmetric difference update(othe 


rset) 或 ss ^= otherset 


从 ss 中 移 除 它 与 其 他 集合 的 交集 , 保留 不 在 其 
他 集合 中 的 元 素 
续 表 
说 明 
EA ss 与 另 一 集合 otherset 交集 的 补 集 ， 将 结 
果 返 回 到 ss 


ss.add( 元 素 ) 向 集合 ss 中 添加 元 素 
sszemove( 元 素 ) 从 集合 ss 中 移 除 元 素 ， 如 果 该 元 素 不 在 ss 中 ， 
则 报告 KeyError 
. -—- 从 集合 ss 中 移 除 元 素 ， 如 果 该 元 素 不 在 ss 中 ， 
ss.discard( 元 素 ) 则 什么 都 不 做 
移 除 并 返回 集合 ss 中 的 任 一 元 素 , 如 果 ss 为 空 ， 
ss popO 则 报告 KeyError 
ss.clear() 清空 集合 ss 中 的 所 有 元 素 


45 ”实验 
4.5.1 ”元 组 的 使 用 


将 元 组 (1, 2, 3, 4) 中 第 二 个 元 素 修改 为 5。 


>>> sample x = (1, 2, 3, 4) 
>>> sample x - list(x) 

>>> sample x[1] = 5 

>>> print(sample x) 


>>> sample tuple = tuple(sample x) 


# 创 建 元 组 x 
# 首 先 将 元 组 转 为 列表 类 型 
# 在 列表 类 型 上 修改 内 容 


# 将 列表 转 为 元 组 


>>> print(type(sample_tuple), sample_tuple) 


运行 结果 如 下 : 


[1, 5, 3, 4] 
«class 'tuple'» (1, 5, 3, 4) 


4.5.2 ”集合 的 使 用 


创建 一 个 集合 nam， 生 成 10 个 200 以 内 的 随机 数 ， 然 后 求 出 最 大 值 、 
最 小 值 以 及 总 和 ， 并 将 这 些 随 机 数 从 小 到 大 排序 ， 最 后 将 结果 输出 。 


>>> import random 


>>> num = random.sample(range(200),10) 


# 导 入 random 模块 
# 生 成 200 以 内 的 10 个 随机 数 


>>> print("10 个 随机 数 为 : \n", num) 


10 个 随机 数 为 : 


[180, 61, 6, 157, 155, 10, 170, 57, 182, 137] # 运 行 结果 
>>> print(" 其 中 最 大 的 数 为 : ", max(num)) HUS 


>>> print(" 其 中 最 小 的 数 为 : ", min(num)) # 输 出 最 小 值 

>>> print(" 总 和 为 :", sum(num)) 3H B EUR 

>>> print(" 从 小 到 大 的 顺序 为 : \n", sorted(num)) # 输 出 从 小 到 大 的 序列 
运行 结果 如 下 : 


其 中 最 大 的 数 为 : 182 

其 中 最 小 的 数 为 : 6 

总 和 为 : 1115 

从 小 到 大 的 顺序 为 : 

[6, 10, 57, 61, 137, 155, 157, 170, 180, 182] 


4.6 小 结 


本 章 讲解 了 Python 的 4 种 组 合 数据 类 型 : 列表、 元 组 、 字 典 和 集合 ， 
以 及 它们 的 特点 、 使 用 方法 等 。 

结合 前 几 章 的 知识 ， 我 们 可 以 知道 ， 不 可 变数 据 类 型 有 4 个 ， 分 别 是 
数字 (Number)、 字 符 串 〈String)、 元 组 〈Tuple) 和 集合 (Set); 元 素 可 变 
的 数据 类 型 有 两 个 ， 分 别 是 列表 (List), FH (Dictionary)。 其 中 ， 列 表 是 
Python 中 使 用 最 为 频繁 的 数据 类 型 之 一 。 

人 们 常 说 ， 一 切 语言 的 基础 就 是 数据 类 型 ， 因 此 ， 理 解 、 掌 握 和 运用 
本 章节 的 内 容 ， 为 学 习 今后 的 课程 做 好 准备 。 


习题 

一 、 程 序 题 

1. 创建 列表 : listl = [Lift','is','short'] 

list2 = ['You',need',python'] 
完成 以 下 任务 : 

(1) 输出 listl 中 的 第 一 个 元 素 Li 及 其 索引 〈 下 标 )。 

(2) 在 short 后 面 增加 一 个 1'。 

2. 创建 列表 ， AEH a-z, A-Z 和 0-9， 从 中 随机 抽出 6 个 字符 作为 验 
证 码 。 

3. 创建 一 个 空 字典 stadent， 录 入 学 生 姓 名 和 成 绩 ， 并 一 一 对 应 ， 当 所 
有 学 生 的 信息 录入 完 之 后 ， 输 入 -1 退出 。 

需要 注意 的 是 ，( 学 生成 绩 范围 为 0~150〉 超 出 范围 重新 输入 。 

二 、 简 答题 
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l. 简 述 元 组 和 列表 的 相同 点 和 不 同 点 。 
2. 简 述 字典 和 集合 的 相同 点 和 不 同 点 。 
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第 5 曹 


字符 串 与 正则 表达 式 


字符 串 是 Python 的 数据 类 型 之 一 ， 用 于 表示 文本 类 型 的 数据 ， 它 也 是 


有 序 的 字符 数组 集合 。 从 严格 


意义 上 来 说 ， 字 符 串 的 序列 是 不 可 变 的 ， 所 


以 不 能 够 直接 修改 字符 串 中 的 字符 。 字 符 串 中 的 字符 是 按照 从 左 到 右 的 顺 
序 ， 并 且 字 符 的 索引 或 位 置 是 以 0 开始 ， 依 次 累加 1 而 进行 标识 的 。 

正则 表达 式 是 操作 字符 串 的 特殊 字符 串 ， 通 过 正则 表达 式 可 以 验证 相 
应 的 字符 串 是 否 符合 对 应 的 规则 。 接 下 来 将 对 字符 串 的 基本 操作 、 字 符 串 
字符 串 格式 化 符号 、 字 符 串 格式 化 元 组 、 字 符 串 方法 以 及 认识 
正则 表达 式 、re 模块 等 内 容 进行 更 深 一 步 的 了 解 。 


5.1 字符 串 基础 


的 格式 化 、 


字符 


英文 状态 下 的 单 引号 CO. Xp CU 或 者 三 引号 〈"") 表示 。 
字符 串 中 还 有 一 种 特殊 的 字符 叫 作 转 义 字符 ， 转 义 字 符 通 常用 于 不 能 
够 直接 输入 的 各 种 特殊 字符 ，Python 常用 转 义 字符 如 表 5.1 所 示 。 


表 5.1 常用 的 转 义 字符 
说 明 
BUR 


中 的 字符 可 以 是 ASCII 字符 ， 也 可 以 是 其 他 各 种 符号 。 它 常 


型 


单 引 号 


双 引 号 


响 铃 符 


退 格 符 


说 明 


水 平 制 表 符 


和 对 直 制 表 符 


Null， 空 字符 串 


以 八进制 表示 的 ASCH 码 对 应 符 


以 十 六 进 制 表示 的 ASCI 码 对 应 符 
5.1.1. 字符 串 的 基本 操作 


字符 串 的 基本 操作 主要 有 求 字符 串 的 长 度 、 字 符 串 的 连接 、 字 符 串 的 
遍历 、 字 符 串 的 包含 判断 、 字 符 串 的 索引 和 切片 等 。 

1. 求 字符 串 的 长 度 

字符 串 的 长 度 是 指 字符 数组 的 长 度 ， 又 可 以 理解 为 字符 串 中 的 字符 个 
数 〈 空 格 也 算 字 符 )， 可 以 用 len0 函 数 查看 字符 串 的 长 度 。 例 如 : 


>>> sample str1 = 'Jack loves Python" 
>>> print(len(sample. str1)) # 查 看 字符 串 长 度 


运行 结果 如 下 : 
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2. 字符 串 的 连接 

字符 串 的 连接 是 指 将 多 个 字符 串 连 接 在 一 起 组 成 一 个 新 的 字符 串 。 例 如 ; 


>>> sample str2 = 'Jack', 'is', 'a', 'Python', 'fan' # 字 符 串 用 逗号 隔 开 ， 组 成 元 组 
>>> print('sample_str2:' , sample str2 , type(sample_str2)) 


运行 结果 如 下 : 

sample_str2: (‘Jack', 'is', 'a', 'Python', 'fan') «class tuple'> 

当 字 符 串 之 间 没 有 任何 连接 符 时 ， 这 些 字 符 串 会 直接 连接 在 一 起 ， 组 
成 新 的 字符 串 。 


>>> sample str3 = 'Jack"is"a"Python"fan' # 字 符 串 间 无 连接 符 ， 默 认 合并 
>>> print(sample str3: ' , sample str3) 


运行 结果 如 下 : 
sample str3: JackisaPythonfan 


字符 串 之 间 用 + 号 连接 时 ， 也 会 出 现 同样 的 效果 ， 这 些 字符 串 将 连接 


Tur 
» 
" 


在 一 起 ， 组 成 一 个 新 的 字符 串 。 

>>> sample_str4 = 'Jack' + 'is' + 'a' + 'Python'  'fan' 

# 字 符 串 + 连接 ， 默 认 合并 

>>> print('sample_str4: ' , sample str4) 

运行 结果 如 下 : 

sample_str4: JackisaPythonfan 

用 字符 串 与 正 整 数 进行 乘法 运算 时 ， 相 当 于 创建 对 应 次 数 的 字符 串 
最 后 组 成 一 个 新 的 字符 串 。 

>>> sample str5 = 'Jack*3 # 重 复 创 建 相应 的 字符 串 

>>> print(sample str5: ', sample str5) 

运行 结果 如 下 : 

sample_str5: JackJackJack 

需要 注意 的 是 ， 字 符 串 直接 以 空格 隔 开 时 ， 该 字符 串 会 组 成 元 组 类 型 。 

3. 字符 串 的 遍历 

通常 使 用 for 循环 对 字符 串 进 行 遍历 。 例 如 


>>> sample str6 = 'Python' # 饥 历 字符 串 
>>>forain sample_str6: 
print(a) 


u 


E 
m 
m 
E 
"n 


2077-70 ği 


其 中 变量 a， 每 次 循环 按 顺 序 代 指 字符 串 里 面 的 一 个 字符 。 

4. 字符 串 的 包含 判断 

字符 串 是 字符 的 有 序 集合 ， 因 此 用 in 操作 来 判断 指定 的 字符 是 否 存在 
包含 关系 。 例 如 : 


>>> sample str7 = 'Python" 


>>> print('a' in sample. str7) # 字 符 串 中 不 存在 包含 关系 
>>> print('Py' in sample_str7) # 字 符 串 中 存在 包含 关系 
运行 结果 如 下 : 

False 


True 


e— 
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5. 索引 和 切片 
字符 串 是 一 个 有 序 集合 ， 因 此 可 以 通过 偏 移 量 实现 索引 和 切片 的 操作 。 
在 字符 串 中 字符 从 左 到 右 的 字符 索引 依次 为 0, 1, 2, 3,…, len0-1， 字 符 从 右 
到 左 的 索引 依次 为 -1,-2,-3,…,-len()。 索 引 其 实 简单 来 说 是 指 字符 串 的 排列 
顺序 ， 可 以 通过 索引 来 查找 该 顺序 上 的 字符 。 例 如 : 
>>> sample str8 = 'Python" 
>>> print(sample str8[0]) 
>>> print(sample str8[1]) 
>>> print(sample str8[-1]) 
>>> print(sample str8[-2]) 


行 结果 如 下 : 


# 字 符 串 对 应 的 第 一 个 字符 

# 字 符 串 对 应 的 第 二 个 字符 

# 字 符 串 对 应 的 最 后 一 个 字符 
# 字 符 串 对 应 的 倒数 第 二 个 字符 


P 
y 
n 
o 


需要 注意 的 是 ， 虽 然 索引 可 以 获得 该 顺序 上 的 字符 ， 但 是 不 能 够 通过 
该 索引 去 修改 对 应 的 字符 。 例 如 : 


>>> sample_str8[0] = 'b' # 修 改 字符 串 的 第 一 个 字符 
Traceback (most recent call last): # 系 统 正常 报错 
File "<pyshell#4>", line 9, in <module> 
sample str8[0] = 'b* 
TypeError: 'str' object does not support item assignment 
切片 ， 也 叫 分 片 ， 和 元 组 与 列表 相似 ， 是 指 从 某 一 个 索引 范围 中 获取 
连续 的 多 个 字符 (又 称 为 子 字 符 )。 常 用 格式 如 下 : 
stringname[start:end] 


这 里 的 stringname 是 指 被 切片 的 字符 串 , start 和 end 分 别 指 开始 和 结束 
时 字符 的 索引 ， 其 中 切片 的 最 后 一 个 字符 的 索引 是 end-1， 这 里 有 一 个 诀窍 
叫 包 左 不 包 右 。 例 如 : 


>>> sample str9 = 'abcdefghijkl' 
>>> print(sample str9[0:4]) 
# 获 取 索 引 为 0~4 的 字符 串 ， 从 索引 0 开始 到 3 为 止 , 不 包括 索引 为 4 的 字符 


运行 结果 如 下 : 
abcd 


若 不 指定 起 始 切 片 的 索引 位 置 ， 默 认 是 从 0 开始 ; 若 不 指定 结束 切片 
的 顺序 ， 默 认 是 字符 串 的 长 度 -1。 例 如 : 
>>> sample str10 = 'abcdefg' 


>>> print(" 起 始 不 指定 ", sample str10[:3]) 

# 获 取 索 引 为 0—3 的 字符 串 ， 不 包括 3 
>>> print(" 结 束 不 指定 ", sample_str10[3:]) 

# 从 索引 3 到 最 后 一 个 字符 ， 不 包括 len 
运行 结果 如 下 : 
起 始 不 指定 abc 
结束 不 指定 defg 


默认 切片 的 字符 串 是 连续 的 ,但 是 也 可 以 通过 指定 步 进 数 〈step) 来 跳 
过 中 间 的 字符 ， 其 中 默认 的 step 是 1。 例 如 指定 步 进 数 为 2: 


>>> sample str11 = '012345678' 
>>> print(' 跳 2 个 字符 ', sample str11[1:7:2]) # 索 引 1-7, 48 2 个 字符 截取 


运行 结果 如 下 : 
跳 2 个 字符 135 


5.1.2 ”字符 串 格 式 化 


想 要 进行 字符 串 格式 化 可 以 使 用 format() 方 法 。 例 如 : 
>>> print(My name is (0), and | am (1) '.format('Jack', 9)) # 函 数 格式 化 
运行 结果 如 下 : 


My name is Jack, and | am 9 


5.1.3 ”字符 串 格式 化 符号 


字符 串 常见 的 格式 化 符号 如 表 5. 2 所 示 。 
3k52 Python 格式 控制 符号 


格式 控制 符 说 明 
%s 字符 串 〈 采 用 str0 的 显示 ) 或 其 他 任何 对 象 
Sor 与 %s 相似 〈 采 用 repr0 的 显示 ) 
Soc 单个 字符 
%b 参数 转换 成 二 进 制 整数 
%d 参数 转换 成 十 进 制 整数 
%i 参数 转换 成 十 进 制 整数 
%0 参数 转换 成 八进制 整数 
%u 参数 转换 成 十 进 制 整数 
%x 参数 转换 成 十 六 进 制 整数 ， 字 母 小 写 
%X 参数 转换 成 十 六 进 制 整数 ， 字 母 大 写 
96e. E 按 科学 计数 法 格式 转换 成 浮 点 数 


格式 控制 符 说 明 


%f. F 按 定 点 小 数 格式 转换 成 浮 点 数 


按 定 点 小 数 格式 转换 成 浮 点 数 ， 与 %f. F 不 同 


5.1.4 字符 串 格 式 化 元 组 


字符 串 的 格式 化 通常 有 两 种 方式 ， 除 了 之 前 提 到 用 函数 形式 进行 格式 
化 以 外 ,还 可 以 用 字符 串 格式 化 表达 式 来 进行 格式 化 ,常用 % 进 行 表 示 ， 其 
中 % 前 面 是 需要 格式 化 的 字符 串 ， 而 % 后 面 就 是 需要 填充 的 实际 参数 ， 这 个 
实际 参数 其 本 质 就 是 元 组 。% 也 可 以 理解 为 占 位 符 。 例 如 ; 

>>> print('My name is %s, and | am %d'%('Jack', 9)) # 瑟 达 式 格式 化 

运行 结果 如 下 : 

My name is Jack, and | am 9 

需要 注意 的 是 ， 如 果 想 要 将 后 面 填充 的 浮 点 数 保留 两 位 小 数 ， 
用 %f2 表示 ， 同 时 会 对 第 三 位 小 数 进行 四 舍 五 入 。 例 如 : 

>>> print(' 你 花 了 %.2f 元 钱 '%(20.45978)) # 浮 点 数 保留 两 个 小 数 

运行 结果 如 下 : 

你 花 了 20.46 元 钱 


可 以 


5.2 ”字符 串 方法 


字符 串 是 str 类 型 对 象 ， 所 以 Python 内 置 了 一 系列 操作 字符 串 的 方法 。 
其 中 常用 的 方法 如 下 : 
1. str.strip([chars]) 


若 方法 里 面 的 chars 不 指定 , 默认 去 掉 字 符号 


的 首 、 尾 空格 或 者 换行 符 ， 


但 是 如 果 指 定 了 chars， 那 么 会 删除 首 


>>> sample funi -' Hello world^#' 
>>> print(sample fun1.strip()) 

>>> print(sample fun1.strip(*?)) 

>>> print(sample fun1.strip(^z")) 


运行 结果 如 下 : 
Hello world^# 


Hello world^ 
Hello world 


尾 的 chars。 例 如 : 


# 默 认 去 掉 首尾 空格 
# 指 定 首尾 需要 删除 的 字符 


2. str.count('chars',start,end) 
统计 chars 字符 串 或 者 字符 在 str 中 出 现 的 次 数 ， 从 start 顺序 开始 查找 


一 直到 end 顺序 范围 结束 ， 默 认 是 从 顺序 0 开始。 例如 : 


>>> sample fun2 = 'abcdabfabbcd' 
>>> print(sample fun2.count('ab',2,9)) # 统 计 字 符 串 出 现 的 次 数 


运行 结果 如 下 : 
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3. str. capitalize() 
将 字符 串 的 首 字母 大 写 。 例 如 : 


>>> sample fun3 = 'abc' 
»»» print(sample fun3.capitalize()) # 首 字母 大 写 


运行 结果 如 下 : 
Abc 


4. str.replace(oldstr, newstr,count) 
用 旧 的 子 字 符 串 蔡 换 新 的 子 字符 串 ， 若 不 指定 count 默认 全 部 替换 。 


例如 : 


>>> sample_fun4 = 'ab12cd3412cd' 

>>> print(sample fun4.replace(12',21")) # 不 指定 替换 次 数 count 
>>> print(sample fun4.replace(12',21',1)) # 指 定 替换 次 数 count 
运行 结果 如 下 : 

ab21cd3421cd 

ab21cd3412cd 


5. strfind('str',start,end) 
查找 并 返回 子 字符 在 start 到 end 范围 内 的 顺序 ， 默 认 范围 是 从 父 字 符 


串 的 头 开始 到 尾 结束 。 例 如 : 


>>> sample fun5 = '0123156' 

>>> print(sample fun5.find(5'))  # 查 看 子 字符 串 的 顺序 

>>> print(sample_fun5.find('5',1,4)) # 指 定 范围 内 没有 该 字符 串 默认 返回 -1 
>>> print(sample_fun5.find('1') # 多 个 字符 串 返 回 第 一 次 出 现时 的 顺序 


运行 结果 如 下 : 
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E] 


E 


6. strindex('str'start,end) 

该 函数 与 find 函数 一 样 ， 但 是 如 果 在 某 一 个 范围 内 没有 找到 该 字符 串 
不 再 返回 -1， 而 是 直接 报错 。 例 如 : 

>>> sample_fun6 = '0123156' 

>>> print(sample_fun6.index(7)) 。 # 指 定 范围 内 没有 找到 该 字符 串 会 报错 
运行 结果 如 下 : 


Traceback (most recent call last): 
File "D:/python/space/demo05-02-03.py", line 2, in <module> 
printsample fun&.index(7)) — # 指 定 范围 内 没有 找到 该 字符 串 会 报错 
TypeError: must be str, not int 


7. strisalnum() 
字符 串 是 由 字母 或 数字 组 成 则 返回 True, AURE False。 例 如 : 


>>> sample_fun7 = 'abc123' # 字 符 串 由 字母 和 数字 组 成 
>>> sample fun8 = 'abc' # 字 符 串 由 字母 组 成 
>>> sample fun9 = '123' # 字 符 串 由 数字 组 成 


>>> sample_fun10 = 'abc1296' # 字 符 串 由 除了 数字 、 字 母 以 外 的 字符 组 成 


>>> print(sample fun7.isalnum()) 
>>> print(sample fun8.isalnum()) 
>>> print(sample fun9.isalnum()) 
>>> print(sample fun10.isalnum()) 


运行 结果 如 下 : 


True 
True 
True 
False 


8. strisalpha() 

字符 串 是 否 全 由 字母 组 成 ， 是 返回 Tme， 否 则 返回 False. flan: 
>>> sample fun11 = 'abc123' # 字 符 串 中 不 只 是 有 字母 
>>> sample fun12 = 'abc' # 字 符 串 中 只 是 有 字母 


>>> print(sample fun11.isalpha()) 
>>> print(sample fun12.isalpha()) 


运行 结果 如 下 : 


False 
True 


9. strisdigit() 
字符 串 是 否 全 由 数字 组 成 ， 是 则 返回 True, FURE False。 例 如 : 


>>> sample fun13 = 'abc12' # 字 符 串 中 不 只 是 有 数字 
>>> sample_fun14 = '12' # 字 符 串 中 只 是 有 数字 
>>> print(sample_fun13.isdigit()) 

>>> print(sample_fun14.isdigit()) 

运行 结果 如 下 : 


False 

True 

10. str.isspace() 

字符 串 是 否 全 由 空格 组 ， 是 则 返回 True, FURE False。 例 如 : 
>>> sample_fun15 - ' abc # 字 符 串 中 不 只 有 空格 
>>> sample fun16 =' _' # 字 符 串 中 只 有 空格 

>>> print(sample fun15.isspace()) 

>>> print(sample fun16.isspace()) 

运行 结果 如 下 : 


False 
True 


11. strislower() 

字符 串 是 否 全 是 小 写 ， 是 则 返回 True, FURE False。 例 如 : 

>>> sample_fun17 = 'abc' # 字 符 串 中 的 字母 全 是 小 写 
>>> sample fun18 = 'Abcd' # 字 符 串 中 的 字母 不 只 有 小 写 
>>> print(sample fun17.islower()) 

>>> print(sample fun18.islower()) 


运行 结果 如 下 : 


True 
False 


12. strisupper() 
字符 串 是 否 全 是 大 写 ， 是 则 返回 Tue， 否则 返回 False。 例 如 : 


>>> sample_fun19 = 'abCa' # 字 符 串 中 的 字母 不 全 是 大 写字 母 
>>> sample fun20 = 'ABCA' # 字 符 串 中 的 字母 全 是 大 写字 母 
>>> print(sample fun19.isupper()) 

>>> print(sample fun20.isupper()) 


运行 结果 如 下 : 


False 
True 


13. stristitle() 
字符 串 首 字母 是 否 是 大 写 ， 是 则 返回 Tme， 否 则 返回 False。 例 如 : 


Bil 3E 


= 


>>> sample fun21 = 'Abc' # 字 符 串 首 字 母 大 写 
>>> sample fun22 = 'aAbc' # 字 符 串 首 字母 不 是 大 写 
>>> print(sample fun21s.istitle()) 

>>> print(sample fun22 istitle()) 


运行 结果 如 下 : 


True 
False 


14. str.low() 
将 字符 串 中 的 字母 全 部 转换 成 小 写字 母 。 例 如 : 


>>> sample fun23 = 'aAbB' # 将 字符 串 中 的 字母 全 部 转换 为 小 写字 母 
>>> print(sample_fun23.lower()) 


运行 结果 如 下 : 
aabb 


15. str.upper() 

将 字符 串 中 的 字母 全 部 转换 成 大 写字 母 。 例 如 : 

>>> sample fun24 = 'abcD' # 将 字符 串 中 的 字母 全 部 转换 为 大 写字 母 
>>> print(sample_fun24.upper()) 

运行 结果 如 下 : 

ABCD 


16. str.splitsep,maxsplit) 

将 字符 串 按 照 指定 的 sep 字符 进行 分 割 ，maxsplit 是 指定 需要 分 割 的 次 
若 不 指定 sep 默认 是 分 割 空格 。 例 如 : 

>>> sample fun25 = 'abacdaef 

>>> print(sample fun25.split('a')) # 指 定 分 割 字符 串 

>>> print(sample fun25.split()) # 不 指定 分 割 字符 串 

>>> print(sample_fun25.split('a',1)) # 指 定 分 割 次 数 

运行 结果 如 下 : 

Bp 'cd', 'ef] 

[abacdaef] 

[", 'bacdaef] 

17. str.startswith(sub[,start[,end]]) 

判断 字符 串 在 指定 范围 内 是 否 以 sub 开头 ， 默 认 范 围 是 整个 字符 串 。 


例如 : 


>>> sample fun26 = '12abcdef 
>>> print(sample fun26.startswith(12,0,5)) ”# 范 围 内 是 否 以 该 字符 开头 
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运行 结果 如 下 : 

True 

18. str.endswith(sub[,start[,end]]) 

判断 字符 串 在 指定 范围 内 是 否 以 sub 结尾 ， 默 认 范 围 是 整个 字符 号 
例如 : 


>>> sample fun27 = 'abcdef12" 
>>> print(sample fun27.endswith(12)) # 指 定 范围 内 是 否 以 该 字符 结尾 


运行 结果 如 下 : 


True 


p 


19. str.partition(sep) 

将 字符 串 从 sep 第 一 次 出 现 的 位 置 开 始 分 隔 成 3 部 分 : sep 顺序 前 、sep、 
sep 顺序 后 。 最 后 会 返回 一 个 三 元 数组 ， 如 果 没 有 找到 sep 时 ， 返 回 字符 本 
身 和 两 个 空格 组 成 的 三 元 数组 。 例 如 : 

>>> sample fun28 = '123456' 

>>> print(sample fun28.partition(34')) # 指 定 字符 分 割 ， 能 够 找到 该 字符 

>>> print(sample fun28.partition(78')) # 指 定 字 符 分 割 ， 不 能 够 找到 该 字符 

运行 结果 如 下 : 

(12 '34', '56') 

('123456', ", ") 


20. str.rpartition(sep) 
该 函数 与 partition(sep) 函 数 一 致 ， 但 是 sep 不 再 是 第 一 次 出 现 的 顺序 ， 
而 是 最 后 一 次 出 现 的 顺序 。 例 如 : 


>>> sample fun29 = '12345634' 
>>> print(sample_fun29.rpartition("34')) # 指 定 字符 最 后 一 次 的 位 置 进行 分 割 | 


运行 结果 如 下 : 
('123456', '34', ") 


53 ”正则 表达 式 


5.3.1 认识 正则 表达 式 


正则 表达 式 CRegular Expression)， 此 处 的 Regular 即 是 “规则 ”“ 规 律 ” 
的 意思 ，Regular Expression 即 “ 描 述 某 种 规则 的 表达 式 ”， 因 此 它 又 可 称 为 
正规 表示 式 、 正 规 表 示 法 、 正 规 表 达 式 、 规 则 表达 式 、 常 规 表 示 法 等 ， 在 


代码 中 常常 被 简写 为 regex, regexp 或 RE。 正 则 表达 式 使 用 某 些 单个 字符 


串 来 描述 或 匹配 某 个 句法 规则 的 字符 串 。 在 很 多 文本 编辑 器 中 ， 正 则 表达 


式 通常 被 用 来 检索 或 蔡 换 那 些 符 合 某 个 模式 的 文本 , 如 表 5.3 一 表 5.6 所 示 。 


表 5.3 单个 字符 匹配 


字符 说 明 
, 匹配 任意 1 个 字符 (除了 \n) 
. [1 匹配 [中 列举 的 字符 \d 
Wd 匹配 数字 ， 即 0 一 9 
\D 匹配 非 数字 ， 即 不 是 数字 
\s RH, ME, Tab 键 
NS 
Ww 匹配 单词 字符 ， 即 a 一 z、A 一 Z、0~9 和 
Ww 匹配 非 单词 字符 
表 5.4 表示 数量 的 匹配 
字符 说 明 
* 匹配 前 一 个 字符 出 现 0 次 或 者 无 限 次 ， 即 可 有 可 无 
十 匹配 前 一 个 字符 出 现 1 次 或 者 无 限 次 ， 即 至 少 有 1 次 
2 匹配 前 一 个 字符 出 现 1 次 或 者 0 次 ， 即 要 么 有 1 次 ， 要 么 没有 
{m} 匹配 前 一 个 字符 出 现 m 次 
(m) 匹配 前 一 个 字符 至 少 出 现 血 次 
{m,n} 匹配 前 一 个 字符 出 现 从 m 到 n 次 
R55 ”表示 边界 的 匹配 
字符 说 明 
8 匹配 字符 串 开 头 
$ 匹配 字符 串 结尾 
\b 匹配 一 个 单词 的 边界 
B 匹配 非 单词 边界 
表 5.6 ”匹配 分 组 
字符 说 明 
| 匹配 左右 任意 一 个 表达 式 
(ab) 将 括号 中 的 字符 作为 一 个 分 组 
mum 引用 分 组 num 匹配 到 的 字符 串 
QP<name>) 分 组 起 别名 


(?P-name) 


引用 别名 为 name 分 组 匹配 到 的 字符 串 


5.3.2 re 模块 


在 Python 中 需要 通过 正则 表达 式 对 字符 串 进行 匹配 时 ， 可 以 导入 一 个 
库 〈 模 块 )， 名 字 为 re， 它 提供 了 对 正则 表达 式 操作 所 需 的 方法 ， 如 表 5.7 
所 示 。 


表 5.7 re 模块 常见 的 方法 


方法 说 明 
: 从 字符 串 的 开始 匹配 一 个 匹配 对 象 , 例如 匹配 
re.match(pattern,string flags) 第 一 个 单词 
. 在 字符 串 中 查找 匹配 的 对 象 , 找到 第 一 个 后 就 返 
Te.search(pattern,string flags) 


加， 如 果 没 有 找到 就 返回 None 
蔡 换 字符 中 的 匹配 项 

分 割 字符 

获取 字符 串 中 所 有 匹配 的 对 象 
创建 模式 对 象 


re.sub(pattern.repl.string count) 


5.3.3 re.match() 方 法 


re.match() 是 用 来 进行 正则 匹配 检查 的 方法 , 若 字符 串 匹 配 正则 表达 式 ， 
则 match0 方 法 返回 匹配 对 象 (Match Object)， 否 则 返回 None (注意 不 是 空 
字符 串 "")。 

匹配 对 象 Match Object 具有 group0 方 法 , 用 来 返回 字符 串 的 匹配 部 分 。 
常用 格式 如 下 : 

re.match(pattern, string, flags=0) 


这 里 的 格式 为 (pattem 正则 表达 式 ' 匹 配 的 字符 串 )。 例 如 : 


>>> import re # 导 入 re 包 

>>> sample result = re.match('Python','Python12') # 从 头 查找 匹配 字符 串 
>>> print(sample result1.group()) # 输 出 匹配 的 字符 串 
运行 结果 如 下 : 

Python 


5.3.4 re.search() 方 法 


re.search() 方 法 和 re.match() 方 法 相似 ， 也 是 用 来 对 正则 匹配 检查 的 方 
法 ， 不 同 的 是 search() 方 法 是 从 字符 串 的 头 开 始 一 直到 尾 进 行 查找 ， 若 正则 
表达 式 与 字符 串 匹 配 成 功 ， 就 返回 匹配 对 象 ， 否 则 返回 None。 例 如 : 


>>> import re 


Python 坦言 一 人 


>>> sample result2 = re.search('Python','354Python12") # 依 次 匹配 字符 串 
>>> print(sample result2.group()) 

运行 结果 如 下 : 

Python 


5.3.5 ”re.match() 与 re.search() 的 区 别 


虽然 rematch) fi re.search() 方 法 都 是 指定 的 正则 表达 式 与 字符 串 进行 
匹配 ， 但 是 re.match0 是 从 字符 串 的 开始 位 置 进行 匹配 ， 若 匹配 成 功 ， 则 返 
回 匹配 对 象 ， 否 则 返回 None. ifj re.search() 方 法 却 是 从 字符 串 的 全 局 进行 
扫描 ， 若 匹配 成 功 就 返回 匹配 对 象 ， 否 则 返回 None。 例 如 : 

>>> import re 

>>> sample result3 = re.match('abc','abcdef1234') #match 只 能 够 匹配 头 

>>> sample result4 = re.match(1234'''abcdef1234") 


>>> print(sample result3.group()) 
>>> print(sample result4) 


>>> sample result5 = re.search('abc','abcdef1234') #search 匹配 全 体 字符 
>>> sample result6 = re.search('1234''abcdef1234") 

>>> print(sample result5.group()) 

>>> print(sample result6.group()) 


运行 结果 如 下 : 
abc 
None 


abc 
1234 


5.4 实验 
5.4.1 “使 用 字符 串 处 理 函 数 


CD 我 们 常 看 到 自己 计算 机 上 的 文件 路 径 如 C:\Windows\Logs\dosve， 
请 将 该 路 径 分 割 为 不 同 的 文件 夹 。 


>>> sample str1 = 'C:\Windows\Logs\dosvc' 
>>> sample_slipstr = sample stri.split(W) 热 转 义 字 符 要 转 一 次 才 是 本 意 
>>> print(sample slipstr) 


运行 结果 如 下 : 
['C:', Windows", 'Logs', 'dosvc'] 


(2) Python 的 官网 是 https:/www.python.org， 判 断 该 网 址 是 否 以 org 
结尾 。 


>>> sample str2 = 'https://www.python.org' 
>>> print(sample. str2.endswith('org?) # 从 字符 串 末尾 开始 查找 


运行 结果 如 下 : 


True 


5.4.2 ”正则 表达 式 的 使 用 


写 出 一 个 正则 表达 式 来 匹配 是 否 是 手机 号 。 
>>> import re # 定 义 一 个 正则 表达 式 
>>> phone rule = re.compile('1\d{10}') 
>>> phone num = input(' 请 输入 一 个 手机 号 ') — ## 通 过 规则 去 匹配 字符 串 
>>> sample result3 = phone rule.search(phone num) 
>>> if sample result3 != None: 
Print(' 这 是 一 个 手机 号 ') 

else: 
print( 这 不 是 一 个 手机 号 ) 
运行 结果 如 下 : 
请 输入 一 个 手机 号 12312345678 


这 是 一 个 手机 号 
Process finished with exit code 0 


请 输入 一 个 手机 号 24781131451 
这 不 是 一 个 手机 号 
Process finished with exit code 0 


5.43 ”使 用 re 模块 


用 两 种 方式 写 出 一 个 正则 表达 式 匹 配 字符 'Python123' 中 的 'Python', 并 输 
出 字符 串 'Python'。 

>>> import re # 导 入 re 包 

>>> sample regu = re.compile('Python') # 定 义 正则 表达 式 规则 

>>> sample result4 = sample_regu.match('Python123') # 用 match 方式 匹配 字 

符 串 

>>> print(sample result4.group()) # 用 search 方式 匹配 字符 串 

>>> sample result5 = sample regu.search('Python123") 

>>> print(sample result5.group()) 
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5.5 ”小结 


本 章 首先 讲解 了 Python 字符 串 概 念 和 字符 串 的 基本 操作 ; 其 次 是 字符 
串 的 格式 化 ， 主 要 是 格式 化 符号 、 格 式 化 元 组 ; 还 有 操作 字符 串 的 基本 方 
法 ， 这 些 符号 和 方法 在 Python 的 开发 中 会 被 经 常 使 用 到 。 之 后 ， 我 们 学 习 
了 正则 表达 式 ，re 模块 和 正则 表达 式 的 基本 表示 符号 ， 这 些 符 号 可 以 帮助 
简化 正则 表达 式 。 

正则 表达 式 的 用 途 非 常 广泛 ， 几 乎 任何 编程 语言 都 可 以 使 用 到 它 ， 所 
以 学 好 正则 表达 式 ， 对 于 提高 自己 的 编程 能 力 有 非常 重要 的 作用 。 


习题 
一 、 单 项 选择 题 
1. 以 下 ) 方法 可 以 查看 字符 串 的 长 度 。 
A. length() B. len() C. lent) D. lan() 


下 列 关 于 字符 串 索 引 说 法 正确 的 是 〈 Js 
字符 串 中 的 第 一 个 字符 是 索引 0 B. 索引 不 是 连续 的 
索引 的 长 度 就 是 字符 串 的 长 度 D. 索引 是 从 1 开始 的 
在 Python 的 正则 表达 式 re 模块 中 关于 search() fll match() 方 法 说 法 正 
( Js 
search() 只 能 够 匹配 字符 串 起 始 位 置 的 字符 
matchO 能 够 匹配 任意 位 置 的 字符 
search() 匹 配 成 功 后 直接 返回 匹配 的 字符 串 
search() 能 够 匹配 任意 位 置 的 字符 
、 填 空 题 
表达 式 'Life is short!'[-5] 的 值 为 
表达 式 'Life is short!'[-5:] 的 值 为 
表达 式 '1,2,*3 的 值 为 
代码 print(re.match('[a-zA-Z]+$'"abcdEGF000")) 的 输出 结果 为 。 。 
三 、 编 程 题 
1. 将 字符 串 'abcdefg' 使 用 函数 的 方式 进行 倒序 输出 。 
2. 在 我 们 的 生活 中 ， 节 假日 的 问候 是 必 不 可 少 的 ， 请 使 用 字符 串 格式 
化 的 方式 写 一 个 新 年 问候 语 模板 。 
3. 写 出 能 够 匹配 163 邮箱 〈@163.com) 的 正则 表达 式 。 
四 、 简 答题 
简 述 re 模块 中 re.match() 与 re.searchO 的 区 别 。 


ii 
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随 着 我 们 学 习 的 深入 ， 编 写 的 Python 代码 也 将 逐一 增加 ， 并 且 逻 辑 也 
越 来 越 复杂 ， 因 此 需要 找到 一 种 方法 对 这 些 复 杂 的 代码 进行 重新 组 织 ， 目 
的 就 是 使 代码 的 逻辑 显得 更 加 简单 、 易 懂 。 我 们 常 说 优秀 的 东西 永远 是 经 
典 的， 而 经 典 的 东西 永远 是 简单 的 ， 不 是 说 复杂 不 好 ， 而 是 把 复杂 的 东西 
简单 化 就 可 以 成 为 经 典 了 。 为 了 使 我 们 的 程序 实现 代码 更 加 简单 ， 要 把 程 
序 分 成 越 来 越 小 的 组 成 部 分 ， 这 里 有 3 种 实现 方式 ， 分 别 是 函数 、 对 象 和 
模块 。 本 章 我 们 将 详细 讲解 函数 的 概念 、 变 量 的 使 用 、 参 数 、 返 回 值 以 及 
如 何 调用 等 。 


16.1 函数 的 概述 
6.1.1 函数 的 定义 


一 个 程序 可 以 按 不 同 的 功能 实现 拆 分 成 不 同 的 模块 ， 而 函数 就 是 能 实 
现 某 一 部 分 功能 的 代码 块 。 

在 Python 中 ， 定 义 一 个 函数 要 使 用 def 语句 ， 依 次 写 出 函数 名 、 括 号 、 
括号 中 的 参数 和 冒号 〈:)， 然 后 在 缩 进 块 中 编写 函数 体 ， 函 数 的 返回 值 用 
return 语句 返回 。 

需要 注意 的 是 ，Python 是 靠 缩 进 块 来 标明 函数 的 作用 域 范围 的 ， 缩 进 
块 内 是 函数 体 ， 这 和 其 他 高 级 编程 语言 是 有 区 别 的 ， 如 C/C+HJava/R 语言 
大 括号 { } 内 的 是 函数 体 。 

我 们 以 自 定义 一 个 求 正方 形 面 积 的 函数 area of square 为 例 , 示例 代码 


如 下 : 
def area of square(x): 
S-X'x 
return s 
Python 不 但 能 非常 灵活 地 定义 函数 , 而 且 本 身 内 置 了 很 多 有 用 的 函数 ， 
可 以 直接 调用 。 


6.1.2 全 局 变量 


在 函数 外 面 定义 的 变量 称 为 全 局 变量 。 全 局 变量 的 作用 域 在 整个 代码 
Bk (文件 、 模 块 )， 在 整个 程序 代码 中 都 能 被 访问 到 。 在 函数 内 部 可 以 去 访 
问 全 局 变量 ， 代 码 如 下 所 示 : 
def foodsprice(per price,number): 
sum price = per price*number 
print(' 全 局 变量 PER. PRICE, 1 的 值 : , PER PRICE 1) 
return sum price 
PER. PRICE. 1 = float(input(' 请 输入 单价 : ')) 
NUMBER 1 = float(input(' 请 输入 斤 数 : ')) 
SUM PRICE, 1 = foodsprice(PER_PRICE_1, NUMBER_1) 
print(' 蔬 菜 的 价格 是 : ', SUM_PRICE_1) 


代码 运行 结果 如 下 : 


请 输入 单价 : 21 

请 输入 斤 数 : 7.5 

全 局 变量 PER_PRICE_1: 21.0 
蔬菜 的 价格 是 : 157.5 


在 上 例 中 , 我 们 在 定义 的 函数 foodsprice 内 部 访问 在 函数 外 面 定义 的 全 
局 变量 PER_PRICE 1， 能 得 到 期 望 的 输入 结果 21. 
在 函数 内 部 可 以 访问 全 局 变量 ， 但 不 要 去 修改 全 局 变量 ， 否 则 会 得 不 
到 想 要 的 结果 。 这 是 因为 在 函数 内 部 试图 去 修改 一 个 全 局 变量 时 ， 系 统 会 
自动 创建 一 个 新 的 同名 的 局 部 变量 去 代替 全 局 变量 , 采用 屏蔽 C Shadowing) 
的 方式 ， 当 函数 调用 结束 后 ， 函 数 的 栈 空间 会 被 释放 ， 数 据 也 会 随 之 释放 ， 
代码 如 下 所 示 : 
def foodsprice(per_price,number): 
sum price = per_price*number 
PER_PRICE_1 = 23 
print(' 修 改 后 的 全 局 变量 PER_PRICE_1 的 值 一 一 1: ,PER_PRICE_1) 
return sum price 
PER PRICE. 1 = float(input( 请 输入 单价 : ")) 
NUMBER_1 = float(input(' 请 输入 斤 数 : ')) 
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SUM PRICE. 1 = foodsprice(PER_PRICE_1,NUMBER_1) 
print(' 修 改 后 的 全 局 变量 PER_PRICE_1 的 值 一 一 2: "PER PRICE 1) 
Print(' 蔬 菜 的 价格 是 : "SUM_PRICE_1) 

运行 结果 如 下 : 

请 输入 单价 : 34 

请 输入 斤 数 : 1.7 

修改 后 的 全 局 变量 PER PRICE 189(&——1: 23 


修改 后 的 全 局 变量 PER_PRICE_1 的 值 一 一 2: 340 
蔬菜 的 价格 是 : 57.8 


在 上 例 中 ， 我 们 试图 在 函数 foodsprice 内 部 去 修改 全 局 变量 
PER PRICE 1 的 值 为 23, 然而 在 函数 外 部 再 次 调用 全 局 变量 PER_PRICE 1 
的 值 时 确 为 用 户 输入 的 值 34。 这 是 因为 ， 程 序 在 调用 函数 foodsprice 时 ， 
采用 的 是 栈 的 数据 结构 存储 变量 ， 执 行 一 个 入 栈 操作 ， 当 遇 到 全 局 变量 
PER PRICE 1 时 ， 它 会 创建 一 个 和 全 局 变量 PER PRICE 1 同名 的 局 部 变 
量 ， 因 此 在 函数 内 部 对 全 局 变量 PER. PRICE 1 值 的 修改 , 仅仅 是 对 同名 的 
局 部 变量 的 重新 赋值 ， 当 函数 调用 结束 后 ， 执 行 一 个 出 栈 操作 ， 会 释放 、 
清空 函数 内 所 有 的 局 部 变量 和 数据 。 

如 果 要 在 函数 内 部 去 修改 全 局 变量 的 值 ， 并 使 之 在 整个 程序 生效 ， 采 
用 关键 字 global 即 可 ， 代 码 如 下 所 示 : 

def foodsprice(per_price,number): 

sum price = per price * number 

global PER. PRICE. 1 

PER PRICE 1-23 

print(' 修 改 后 的 全 局 变量 PER PRICE, 1 的 值 一 一 1: "PER PRICE 1) 
return sum price 

PER PRICE, 1 = float(input( 请 输入 单价 : ") 

NUMBER_1 = float(input(' 请 输入 斤 数 : )) 

SUM PRICE 1 = foodsprice(PER PRICE 1,NUMBER 1) 

print(' 修 改 后 的 全 局 变量 PER_PRICE_1 的 值 一 一 2: 'PER PRICE 1) 

Print(' 蔬 菜 的 价格 是 : "SUM_PRICE_1) 

代码 运行 结果 如 下 : 


请 输入 单价 : 45 

请 输入 斤 数 : 7.5 

修改 后 的 全 局 变量 PER_PRICE_1 的 值 一 一 1: 23 
修改 后 的 全 局 变量 PER_PRICE_1 的 值 一 一 2: 23 
蔬菜 的 价格 是 : 337.5 


在 上 例 中 ， 我 们 在 函数 foodsprice 中 在 全 局 变量 PER. PRICE 1 前 加 了 
关键 字 global， 程 序 就 不 会 在 调用 函数 时 创建 一 个 和 全 局 变量 
PER PRICE 1 同名 的 局 部 变量 ， 因 此 当 我 们 在 函数 内 部 对 全 局 变量 


PER PRICE 1 重新 赋值 为 23 时 ， 这 个 值 在 整个 作用 域 都 有 效 ， 当 我 们 在 
函数 外 再 输出 全 局 变量 PER PRICE 1 的 值 时 , 仍然 为 在 函数 内 部 修改 的 值 
23。 


6.1.3 ”局 部 变量 


在 函数 内 部 定义 的 参数 和 变量 称 为 局 部 变量 ， 超 出 了 这 个 函数 的 作用 
域 局 部 变量 是 无 效 的 ， 它 的 作用 域 仅 在 函数 内 部 。Python 在 运行 函数 时 ， 
利用 栈 进行 存储 ， 把 函数 所 需要 的 代码 、 变 量 、 参 数 等 放 入 栈 内 。 当 执行 
完 该 函数 时 ， 函 数 会 自动 被 删除 ， 栈 的 数据 会 自动 被 清空 ， 所 以 函数 外 是 
不 能 访问 到 函数 内 的 局 部 变量 的 ， 代 码 如 下 所 示 : 
def foodsprice(per_price,number): 
sum price = per price * number 
return sum price 
PER PRICE 1 = float(input(' 请 输入 单价 : )) 
NUMBER_1 = float(input(' 请 输入 斤 数 : ) 
SUM PRICE, 1 = foodsprice(PER_PRICE_1,NUMBER_1) 
print(' 蔬 菜 的 价格 是 : 'SUM PRICE. 1) 
print(' 局 部 变量 sum price 的 值 : ,sum_price) 


代码 运行 结果 如 下 : 


请 输入 单价 : 12 
请 输入 斤 数 : 1.56 
蔬菜 的 价格 是 : 18.72 
Traceback (most recent call last): 
File "G:/Python 教材 编写 / 书 中 例子 /6_1_3.py", line 9, in «module» 
Print(' 局 部 变量 sum price 的 值 : ,sum_price) 
NameError: name 'sum price' is not defined 


在 上 例 中 ,我 们 试图 在 函数 作用 域外 访问 函数 内 的 局 部 变量 sum price, 
程序 运行 到 此 处 时 报 出 了 NameError 的 异常 , 提示 变量 sum. price 没有 定 
X. 


6.2 ”函数 的 参数 和 返回 值 


在 了 解 了 函数 的 定义 、 全 局 变量 、 局 部 变量 的 概念 之 后 ， 我 们 来 学 习 
函数 的 参数 和 函数 的 返回 值 。 
函数 的 参数 就 是 使 得 函数 个 性 化 的 一 个 实例 ， 代 码 如 下 所 示 : 


>>> def MyFirstFunction(name city): 
print(' 我 喜欢 的 城市 : ' name city) 
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运行 结果 如 下 : 

>>> MyFirstFunction( 南 京 ) 

我 喜欢 的 城市 :南京 

>>> MyFirstFunction(` 上 海 ) 

我 喜欢 的 城市 :上 海 

在 上 例 中 ， 我 们 对 函数 MyFirstFunction 的 形 参 name city 赋予 不 同 的 
实 参 “南京 ”“ 上 海 ” 后 ， 函 数 就 输出 不 同 的 结果 。 

函数 有 了 参数 之 后 ， 函 数 的 输出 结果 变 得 可 变 了 ， 如 果 需 要 多 个 参数 ， 
函数 用 逗号 “,”( 英 文 状态 下 输入 ) 隔 开 即 可 ， 代 码 如 下 所 示 : 

>>> def Subtraction(num 1,num 2): 

result = num 1 - num 2 
print(result) 

运行 结果 如 下 : 

>>> Subtraction(78,12) 

66 

在 上 例 中 ， 我 们 在 定义 函数 Subtraction 时 ， 用 了 两 个 参数 num 1 和 
num_2， 参 数 之 间 用 逗号 “,”( 英 文 状 态 下 输入 ) 隔 开 。 

在 Python 中 对 函数 参数 的 数量 没有 限制 ， 但 是 定义 函数 参数 的 个 数 不 
宜 太 多 ， 一 般 2 一 3 个 即 可 。 在 定义 函数 时 ， 一 般 要 把 函数 参数 的 意义 注释 
清楚 ， 便 于 阅读 程序 。 

那 什么 是 形 参 和 实 参 呢 ? 

函数 小 括号 “0” 内 的 参数 叫 形 参 , 如 上 例 中 的 参数 name city 是 形 参 ， 
因为 它 只 是 一 个 形式 ， 表 示 占 据 一 个 参数 位 置 。 而 实 参 则 指 函数 在 调用 过 
程 中 传递 进来 的 参数 ， 如 上 例 中 的 “南京 "上海 ” 叫 作 实 参 ， 因 为 它 是 具 
体 的 数值 。 


6.2.1 参数 传递 的 方式 


在 Python 中 ， 将 函数 参数 分 为 3 类 : 位 置 参数 、 可 变 参数 、 关 键 字 参 
数 ， 函 数 参数 的 类 型 不 同 ， 参 数 的 传递 方式 也 不 一 致 ， 下 面 将 分 别 介 绍 。 

1. 位 置 参 数 

直接 传 入 参数 数据 即 可 ， 如 果 有 多 个 参数 ， 位 置 先后 顺序 不 能 改变 。 

fill, func name (" 测 试 数 据 "，23)， 不 能 变 为 func. name (23 , "测试 数 
据 ")， 否 则 会 引起 调用 错误 。 

2. 可 变 参数 

有 两 种 传递 方式 : 一 是 直接 传 入 参数 值 ， 二 是 先 封装 成 列表 (list) 或 


元 组 (tuple)， 再 在 封装 后 的 列表 或 元 组 前 面 添加 一 个 星 号 “*” 传 入 。 

fij, func name (1l, "string 1"，" 编 程 ") 是 直接 传 入 ，func_name (*(1, 
"Python 语言 ")) 是 封装 成 列表 后 再 传 入 。 

3. 关键 字 参 数 

有 两 种 传递 方式 : 一 是 直接 传 入 参数 值 ， 二 是 可 以 先 将 参数 封装 成 字 
典 〈dict)， 再 在 封装 后 的 字典 前 添加 两 个 星 号 “*#**#” 传 入 。 

例如 , func test (a=1, b="string 2") 是 直接 传 入 参数 值 ; fune. name (** ('a': 
12, '': 2}) 是 先 封装 成 字典 后 再 传 入 。 


6.2.2 ”位 置 参数 和 关键 字 参 数 


1 位置 参数 

调用 函数 时 ， 传 入 参数 值 按照 位 置 顺序 依次 赋 给 参数 ， 这 样 的 参数 称 
为 位 置 参数 ， 代 码 如 下 所 示 : 

def Sub(x, y): 

return x-y 
行 结果 如 下 : 

>>> Sub(100,30) 

70 

EHF, Sub (x, y) 函 数 有 两 个 参数 : x 和 y 这 两 个 参数 都 是 位 置 参 数 ， 
调用 函数 时 , 传 入 的 两 个 值 按照 位 置 顺序 依次 赋 给 参数 x 和 y， 得 到 的 两 数 
相 减 的 结果 是 70。 

如 果 交 换 了 参数 的 位 置 ， 就 会 得 到 不 同 的 结果 ， 如 上 例 中 交换 参数 后 
的 运行 结果 如 下 : 

>>> Sub(30,100) 

-70 

从 上 面 的 运行 结果 可 以 看 出 ， 交 换 了 参数 顺序 后 的 运行 结果 是 -70， 而 
不 是 我 们 期 望 的 结果 70。 

2. 关 键 字 参 数 

关键 字 参 数 就 是 在 函数 调用 时 ， 通 过 参数 名 指定 需要 赋值 的 参数 。 通 
常 在 调用 一 个 函数 时 ， 如 果 参 数 有 多 个 ， 我 们 常常 会 混淆 一 个 参数 的 顺序 ， 
达 不 到 我 们 希望 的 效果 。 在 Python 中 引入 关键 字 参 数 就 可 解决 这 个 潜在 的 
问题 ， 代 码 如 下 所 示 : 


>>> def Subtraction(num 1,num 2): 
return (num 1 - num 2) 
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运行 结果 如 下 : 

>>> Subtraction(34,11) 

23 

>>> Subtraction(11,34) 

-23 

>>> Subtraction(num_2=11,num_1=34) 

23 

在 上 例 中 ， 调 用 函数 Subtraction 时 : 第 1 次 调用 函数 Subtraction 时 ， 
给 两 个 参数 顺序 赋值 34、11 时 得 到 的 结果 是 23; 第 2 次 调用 该 函数 时 ， 交 
换 了 两 个 赋值 参数 的 顺序 ， 得 到 的 结果 是 -23， 这 不 是 所 期 望 的 结果 ; 第 3 
次 调用 该 函数 时 ， 引 用 了 关键 字 参 数 并 对 其 分 别 赋值 ， 虽 然 改 变 了 顺序 ， 
但 仍然 得 到 了 所 期 望 的 结果 23。 


6.2. ”默认 值 参数 


在 定义 函数 时 给 参数 赋 了 一 个 初 值 ， 这 样 的 参数 称 为 默认 值 参 数 。 应 
用 默认 值 参数 的 意义 在 于 ， 当 在 函数 调用 时 忘记 了 给 函数 参数 赋值 ， 函 数 
就 会 自动 去 找 它 的 初 值 ， 使 用 默认 值 来 代替 ， 而 使 函数 调用 不 会 出 现 错误 ， 
代码 如 下 所 示 : 

>>> def Subtraction(num 1299,num 2-745): 

return (num 1 - num 2) 

运行 结果 如 下 : 

>>> Subtraction() 

54 

>>> Subtraction(46) 

1 

>>> Subtraction(46,12) 

34 

在 上 例 中 ， 函 数 Subtraction 的 功能 为 返回 两 个 数 相 减 的 结果 ， 在 定义 
函数 时 分 别 给 两 个 参数 num_1、num_2 赋 了 初 值 99 和 45， 分 别 做 了 3 次 调 
用 : 第 1 次 调用 时 没有 赋值 ， 程 序 就 引用 了 两 个 参数 的 默认 值 99、45， 返 
回 的 结果 是 54. 第 2 次 调用 时 ， 给 第 1 个 参数 赋值 为 46， 程 序 就 引用 了 第 
2 个 参数 的 默认 值 45， 返回 的 结果 是 1; 第 3 次 调用 时 ， 给 两 个 参数 分 别 赋 
值 为 46 和 12， 程 序 就 没有 引用 函数 定义 的 默认 值 ， 返 回 的 结果 是 34。 


6.2.4 JESA 


当 在 定义 函数 参数 时 ， 我 们 不 知道 究竟 需要 多 少 个 参数 时 ， 只 要 在 参 


数 前 面 加 上 星 号 “*” 即 可 ， 这 样 的 参数 称 为 可 变 参 数 ， 代 码 如 下 所 示 : 
>>> def val par(*param): 
print $8 — 4-835 5: ,param[2]); 
print(' 可 变 参 数 的 长 度 是 : ".len(param)); 
运行 结果 如 下 : 
>>> val_par(' 南 京 云 创 科技 股份 ',345,9,9.8,2.37,'Python') 
第 三 个 参数 是 : 9 
可 变 参 数 的 长 度 是 : 6 
在 上 例 中 ， 定 义 函数 val par 的 参数 param 为 可 变 参 数 ， 在 调用 该 函数 
时 就 可 以 根据 实际 的 应 用 来 输入 不 同 长 度 、 不 同类 型 的 参数 值 。 
[ 变 参 数 又 称 收集 参数 ， 是 将 一 个 元 组 赋值 给 可 变 参 数 。 如 果 可 变 参 
数 后 面 还 有 其 他 参数 ， 在 参数 传递 时 要 把 可 变 参 数 后 的 参数 作为 关键 字 参 
数 来 赋值 ， 或 者 在 定义 函数 参数 时 要 给 它 赋 默 认 值 ， 否 则 会 出 错 。 
代码 如 下 所 示 : 
>>> def val_par(*param,str1): 
print( 第 三 个 参数 是 : ,param[2]); 
print( 可 变 参 数 的 长 度 是 : "len(param)); 
运行 结果 如 下 : 
>>> val_par( 南 京 云 创 科技 股份 ,345,9,9.8,2.37,Python', 函 数 ) 
SyntaxError unexpected indent 
>>> val_par( 南 京 云 创 科技 股份 ,345,9,9.8,2.37, Python'str1=' 函 数 ) 
第 三 个 参数 是 : 9 
可 变 参 数 的 长 度 是 : 6 
在 上 例 中 , 在 定义 函数 val parO0 时 分 别 定义 了 1 个 可 变 参数 param 和 1 
个 普通 参数 strl, 在 第 1 次 调用 该 函数 时 由 于 没有 将 可 变 参 数 后 面 的 普通 参 
数 作为 关键 字 参 数 来 传 值 ， 导 致 程序 运行 时 报错 。 在 第 二 次 调用 该 函数 时 
将 可 变 参数 后 的 普通 参数 作为 关键 字 参 数 传 值 (str1=' 函 数 ) 后 ， 程 序 运行 正 
常 。 
代码 如 下 所 示 : 
>>> def val_par(*param,str1=' 可 变 函 数 '): 
print( 可 变 参数 后 的 参数 是 : ,str1); 
print( 可 变 参数 的 长 度 是 : "len(param)); 
运行 结果 如 下 : 
>>> val_par(' 南 京 云 创 科技 股份 ',345,9,9.8,2.37,'Python') 


可 变 参 数 后 的 参数 是 : 可 变 函 数 
可 变 参 数 的 长 度 是 : 6 
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在 上 例 中 , 在 定义 函数 val par0 时 分 别 定 义 了 1 个 可 变 参数 param 和 1 
个 普通 参数 str1， 并 给 参数 strl 赋 了 初 值 “可 变 函 数 ”， 在 调用 该 函数 时 没 
有 将 可 变 参数 后 面 的 普通 参数 值 作为 关键 字 参 数 来 传 值 ， 程 序 运行 仍然 正 
常 ， 程 序 引 用 了 函数 的 默认 值 参数 。 


6.2.5 ”函数 的 返回 值 


有 些 时 候 ， 需 要 函数 返回 一 些 数据 来 报告 函数 实现 的 结果 。 在 函数 中 
用 关键 字 retum 返回 指定 的 值 ， 代 码 如 下 所 示 : 
>>> def Subtraction(num 1,num 2): 
return (num 1 - num 2) 
运行 结果 如 下 : 


>>> print(Subtraction(65,23)) 
42 

>>> Subtraction(34,11) 

23 


在 上 例 中 ， 函 数 Subtraction) H KHF retum 返回 了 两 数 相 减 的 结果 。 
函数 中 如 果 没 有 用 关键 字 retum 指定 返回 值 ， 则 返回 一 个 None 对 象 ， 
代码 如 下 所 示 : 


>>> def test_return(): 
print('Hello First1') 

运行 结果 如 下 : 

>>> tempt = test_return() 

Hello First1 

>>> tempt 

>>> print(tempt) 

None 


>>> type(tempt) 
«class 'NoneType'> 


在 上 例 中 ， 定 义 函 数 test_retum() 时 ,没有 用 关键 字 retum 指定 返回 值 ， 
当 检 查 函 数 返 回 类 型 时 ， 系 统 就 返回 一 个 默认 的 类 型 None. 

Python 是 动态 的 确定 变量 类 型 ，Python 没有 变量 ， 只 有 名 字 。Python 
可 以 返回 多 个 类 型 的 值 。 

代码 如 下 所 示 : 


>>> def back test(): 
return [南京 云 创 科技 ,3.67,567] 


运行 结果 如 下 : 
>>> back test() 
【南京 云 创 科技 , 3.67, 567] 
在 上 例 中 ，Python 返回 多 个 值 是 列表 数据 。 
代码 如 下 所 示 : 
>>> def back_test(): 
return 南京 云 创 科技 ,3.67,567 
运行 结果 如 下 : 
>>> back_test() 
(南京 云 创 科技 ', 3.67, 567) 
在 上 例 中 ，Python 返回 多 个 值 是 元 组 数据 。 


6.3 ”函数 的 调用 
6.3.1 函数 的 调用 方法 


要 调用 一 个 函数 ， 需 要 知道 函数 的 名 称 和 参数 。 

函数 分 为 自 定义 函数 和 内 置 函 数 。 

自 定义 函数 需要 先 定义 再 调用 ， 内 置 函 数 直 接 调 用 ， 有 的 内 置 函 数 是 
在 特定 的 模块 下 ， 这 时 需要 用 import 命令 导入 模块 后 再 调用 。 

可 以 在 交互 式 命令 行 通过 help AAH) 查看 函数 的 帮助 信息 。 

调用 函数 时 ， 如 果 传 入 的 参数 数量 不 对 ， 会 报 TypeError 的 错误 ， 同 时 
Python 会 明确 地 告诉 你 参数 的 个 数 。 如 果 传 入 的 参数 数量 是 对 的 ， 但 参数 
类 型 不 能 被 函数 所 接受 ， 也 会 报 TypeError 的 错误 ， 同 时 给 出 错误 信息 。 

函数 名 其 实 就 是 指向 一 个 函数 对 象 的 引用 ， 可 以 把 函数 名 赋 给 一 个 变 


a 
里 。 


6.3.2 WEHA 
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数 。 内 嵌 函 数 的 作用 域 在 其 内 部 ， 如 果 内 赃 函 数 的 作用 域 超 出 了 这 个 范围 
就 不 起 作用 ， 代 码 如 下 所 示 : 
>>> def function 1(): 
print(' 正 在 调用 function. 1()...") 
def function_2(): 
print(' 正 在 调用 function 2()...") 
function_2() 
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运行 结果 如 下 : 
>>> function_1() 
正在 调用 function. 1()... 
正在 调用 function_2()… 
>>> function_2() 
Traceback (most recent call last): 
File "<pyshell#7>", line 1, in <module> 
function_2() 
NameError: name 'function 2' is not defined 


EPF, function 20 是 在 function_ 10 内 部 定义 的 内 嵌 函 数 ， 当 调用 
function 10 时 ， 程 序 运 行 正确 当 直 接 调用 function 20 时 ， 程 序 报错 ， 提 
示 函 数 function 20 没 有 定义 , 这 是 因为 函数 function. 20 是 function. 10 的 内 


嵌 函 数 ， 在 内 嵌 函 数 的 外 部 调用 ， 己 经 超出 了 作用 域 范围 。 
6.3.3 ”使 用 闭 包 


闭 包 是 函数 式 编程 的 一 个 重要 的 语法 结构 。 从 表现 形式 上 定义 为 ， 如 
果 在 一 个 内 部 函数 里 对 一 个 外 部 作用 域 〈 但 不 是 在 全 局 作用 域 ) 的 变量 进 


行 引用 ， 那 么 内 部 函数 就 认为 是 闭 包 〈closure)， 代 码 如 下 所 示 : 

def Fun_sub(a): 

def Fun sub2(b): 

return a-b 

return Fun sub2 
i = float(input(' 请 输入 减 数 : )) 
j = float(input(' 请 输入 被 减 数 : )) 
print(Fun sub(i)(j)) 
运行 结果 如 下 : 
请 输入 减 数 : 67 
请 输入 被 减 数 : 45 
22.0 
>>> Fun_sub2(23) 
Traceback (most recent call last): 

File "«pyshell&8»", line 1, in «module» 

Fun sub2(23) 

NameError: name 'Fun sub2' is not defined 


在 上 例 中 ， 内 部 函数 Fun_sub20 引 用 了 外 部 作用 域 的 变量 a。 如 果 在 全 
局 范围 内 直接 访问 闭 包 Fun_sub20, 程序 会 报错 , 提示 闭 包 函数 Fun_sub20 


没有 定义 。 


在 调用 时 需要 注意 的 是 ， 不 能 在 全 局 域内 访问 闭 包 ， 否 则 会 出 错 。 在 


闭 包 中 ， 外 部 函数 的 局 部 变量 对 闭 包 中 的 局 部 变量 (相当 于 全 局 变量 和 


局 


部 变量 的 关系 ), 在 闭 包 中 能 访问 外 部 函数 的 局 部 变量 , 但 是 不 能 进行 修改 。 
6.3.4 ”递归 调用 


递归 是 算法 的 范畴 ， 从 本 质 上 讲 不 是 Python 的 语法 范围 。 
函数 调用 自身 的 行为 是 递归 。 
递归 的 两 个 条 件 : 调用 函数 自身 ， 设 置 了 正确 的 返回 条 件 。 递 归 即 是 
有 进去 必须 有 回来 。 
例如 ， 要 计算 正 整 数 M 的 阶乘 ， 数 学 计算 公式 是 : Number-M* 
(M-1)*(M-2)*...*3*2*], 
用 常规 的 迭代 算法 实现 ， 代 码 如 下 所 示 : 
def factorial(m): 
result - m 
for i in range(1,m): 
result *-i 
return result 
number = int(input( 请 输入 一 个 正 整数 : )) 
result = factorial(/number) 
print("%d 的 阶乘 是 : %d" 96 (number,result)) 
运行 结果 如 下 : 
请 输入 一 个 正 整数 : 10 
10 的 阶乘 是 : 3628800 
用 递归 算法 实现 ， 代 码 如 下 所 示 : 
def jiecheng(L): 
L=% 
return 1 
else: 
return L* jiecheng(L-1) 
number = int(input( 请 输入 阶乘 的 数字 : ") 
result = jiecheng(number) 
print("%d 的 阶乘 是 : 96d" 96 (number,result)) 
运行 结果 如 下 : 
请 输入 阶乘 的 数字 : 23 
23 的 阶乘 是 : 25852016738884976640000 
在 上 述 两 个 例子 中 ， 都 实现 了 计算 正 整数 阶乘 的 功能 ， 但 后 例 中 的 递 
归 算 法 比 传统 的 迭代 算法 的 代码 简洁 、 易 读 。 
Python 默认 递归 深度 100 层 (Python 限制 )。 设 置 递 归 的 深度 的 系统 函 
数 是 sys.setrecursionlimit (stepcount)， 参 数 stepcount 设置 递归 的 深度 。 
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递归 有 危险 性 ， 即 消耗 时 间 和 空间 ， 因 为 递归 是 基于 弹 栈 和 出 栈 操作 。 
递归 忘掉 返回 时 会 使 程序 崩溃 ， 消 耗 掉 所 有 内 存 。 


6.4 实验 
6.4.1 ”声明 和 调用 函数 


声明 一 个 函数 要 使 用 def 语句 ， 依 次 写 出 函数 名 、 括 号 、 括 号 中 的 参数 
和 冒号 CO, 然后 在 缩 进 块 中 编写 函数 体 , 函数 的 返回 值 用 return 语句 返回 。 
声明 一 个 函数 ， 实 现 的 功能 为 : SR x 的 y 次 方 。 
打开 IDLE 环境 ， 选 择 菜单 File 中 的 New File 选项 ， 打 开 新 的 编辑 窗 
口 ， 输 入 程序 代码 。 
实验 示例 数据 如 下 : 
def func(x y): SUE. SU 
number -x**y EL UR SK x B9 y RA 
return number # 返 回 值 
调用 已 经 声明 好 的 函数 ， 直 接 引 用 函数 名 传 入 参数 即 可 。 
在 上 述 声明 函数 窗口 保存 文件 ， 选 择 菜单 run 中 的 Run Module 选项 ， 
或 者 按 功能 键 F5， 在 Sheel 窗口 中 调用 函数 。 
传 入 实验 参数 ， 运 行 结果 如 下 : 


>>> print(func(34,12)) 
2386420683693101056 


6.4.2 ”在 调试 窗口 中 查看 变量 的 值 


本 实验 采用 Python 3.6.5 Shell 环境 。 

启动 IDLE 调试 窗口 的 步骤 如 下 : 

(1) 在 Shell 窗口 中 单 击 Debug 菜单 中 的 Debugger 菜单 项 ， 就 会 打开 
Debug Control 窗口 , 并 在 Shell 窗口 中 输出 [DEBUG ON] 和 命令 提示 符 >>>。 

Shell 窗口 显示 如 下 : 

Python 3.6.5 (v3.6.5:f59c0932b4, Mar 28 2018, 16:07:46) [MSC v.1900 32 bit 

(Intel)] on win32 

Type "copyright", "credits" or "license()" for more information. 

>>> 


[DEBUG ON] 
>>> 


信息 [DEBUG ON] 表 示 调 试 器 开启 。 在 命令 符 >>> 后 面 输入 语句 行 ， 按 


Enter 键 后 , 语句 行 信息 就 会 显示 在 Debug Control 窗口 , 我 们 就 可 查看 局 部 
变量 和 全 局 变量 等 有 关内 容 。 

下 面 输入 以 下 实验 数据 : 

>>>45+78 

Debug Control 窗口 显示 如 图 6.1 所 示 。 


,| Stack [7 Source 
F Locals Globals 
<pyshells0>:1: <module>0 


fbdb'.run0, line 434: exec(cmd, globals, locals) 


annotations 0 
_builtins_ «module 'builtins (built-in)> 
doc. None 
_loader_ «dass' frozen importiib.BuiltinImporter'» 
name. main_， 
—package_ None 
specs None 


图 6.1 Debug Control 窗口 

窗口 中 有 4 个 复 选 框 ，Stack 显示 堆栈 ，Locals 显示 局 部 变量 ，Globals 
显示 全 局 变量 ，Source 显示 源 代码 。 

窗口 中 有 5 个 功能 按钮 ，Go 运行 到 断 点 处 ，Step 单 步调 试 ，Over 进入 
所 调用 的 函数 内 部 ，Out 跳出 函数 体 ，Quit 停止 调试 运行 。 

(2) 再 次 单 击 Shell 窗口 中 Debug 菜单 中 的 Debugger 菜单 项 ， 系 统 会 
XH] Debug Control 窗口 ， 并 在 Python Shell 窗口 中 输出 [DEBUG OFF]， 表 
示 调 试 器 关闭 。 显 示 实 验 信息 如 下 : 

[DEBUG ON] 

>>> 45+78 

123 

[DEBUG ON] 


[DEBUG OFF] 

在 调试 窗口 中 查看 Python 文件 的 变量 ， 在 程序 调试 中 非常 重要 。 下 面 
将 实现 如 何在 调试 窗口 中 查看 文件 中 的 变量 值 。 

(1) 启动 Shell。 
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(2) 在 Shell 窗口 中 单 击 Debug 菜单 中 的 Debugger 菜单 项 。 
(3) 在 Shell 窗口 中 单 击 File 菜单 中 的 Open 菜单 项 ， 打 开 实 验 文 件 
6 4 2.py， 文 件 信息 显示 如 下 : 


def foodsprice(per_price,number): 

sum price = per price * number 

return sum price 
per. price 1 = float(input(' 请 输入 单价 : ')) 
number_1 = float(input(' 请 输入 斤 数 : )) 
sum price 1 = foodsprice(per price 1,number 1) 
print(' 蔬 菜 的 价格 是 : "sum price 1) 


(4) 在 .py 文件 中 ， 在 要 设置 调试 断 点 的 语句 处 右 击 ， 在 弹出 的 快 
捷 菜 单 中 选择 Set Breakpoint 命令 ， 调 试 断 点 语句 行 高 亮 黄 色 显 示 ， 如 
6.2 所 示 。 


[È 6 4 2.py - GAPythonVPythonditt18 9 987:20180619 1VBETAESE8ETA6 4... 


Elle Edit Format Run Options Window Help 
jef foodsprice(per price, number) 
gu price * per price * nuaber 
sum price 


per price | = float Ginput CR Mih: 7) 
number | = float(input( WS A Fr: 7) 

sum price | = foodsprice(per price number 1) 
print ("蔬菜 的 价格 是 :“, sun_price_1) 


图 6.2 在 .py 文件 中 设置 调试 断 点 
C5) 在 打开 的 .py 文件 窗口 中 单 击 Run 菜单 中 的 Run. Module 菜单 项 ， 
或 者 按 F5 键 ， 系 统 切换 到 Debug Control 窗口 。 此 时 用 户 就 可 以 根据 程序 
调试 的 需要 ， 选择 相 应 的 模式 了 。 实 验 中 ， 单 击 Go 按钮 运行 程序 ， 根 据 程 
序 功 能 ， 按 照 提示 ， 依 次 在 Shell 窗口 中 输入 以 下 信息 : 


[DEBUG ON] 
>>> 


======== RESTART: Gi\Python\ 例 子 \ 实 验 例子 \6_4_2.py ======== 
请 输入 单价 : 7.8 
请 输入 斤 数 : 2.1 


(6) 程序 运行 到 设置 的 断 点 语句 print. (' 蔬 菜 的 价格 是 : ', sum price 1) 
处 ， 然 后 在 Debug Control 窗口 显示 如 图 6.3 所 示 的 变量 信息 。 


_annotations_ 0 


_builtins_ «module 'builtins' (built-in)> 

doc. None 

file - 'GA\N\Python\\\\Python 教 材 编写 ...1\N\N\\ 例 子 \N\ 实 验 例 子 \\\\6_4_2.py 
_loader_ «class ' frozen importlib.Builtinimporter'» 

.name ' main ' 


package None 

spec None 

foodsprice «function foodsprice at 0x04457420» 
number 1 24 

per price 1 7.8 


sum price 1 — 16.38 
6.8 在 .py 文件 中 显示 的 Locals 变量 
(7) 再 次 单 击 Shell 窗口 中 Debug 菜单 中 的 Debugger 菜单 项 ， 结 束 调试 。 


6.4.3 ”使 用 函数 参数 和 返回 值 


Python 函数 的 参数 类 型 一 共有 5 种 : 位 置 或 关键 字 参 数 
(POSITIONAL OR KEYWORD)、 任 意 数量 的 位 置 参数 VAR_POSITIONAL)、 
任意 数量 的 关键 字 参 数 ( VAR KEYWORD )、 仅 关键 字 的 参数 
(KEYWORD ONLY), 仅 位 置 的 参数 (POSITIONAL ONLY). 

函数 的 返回 值 就 是 retum 语句 的 结果 ， 返 回 值 作为 函数 的 输出 ， 可 以 
用 作 变 量 调用 。 返 回 类 型 可 多 种 ， 但 只 能 返回 单 值 ， 值 可 以 存在 多 个 元 素 。 
下 面 的 实验 将 演示 如 何 使 用 函数 参数 和 返回 值 。 

CD 参数 的 类 型 为 位 置 或 关键 字 参 数 (POSITIONAL OR KEYWORD) 
可 以 通过 位 置 或 关键 字 传 值 。 
实验 数据 : 
>>> def func_test(args): 
return args 
结果 如 下 : 


失 通 过 位 置 传 值 
>>> test1 = func test A T Ef) 


3 


>>> print(test1) 

人 工 智能 

IEEE SEE B 

>>> test2 = func test(args-'Python") 
>>> print(test2) 

Python 


(2) 参数 类 型 为 任意 数量 的 位 置 参数 (VAR_POSITIONAL) 时 , Bü*args 


参数 ， 只 能 通过 位 置 传 值 。 


>>> def para test(*args): 
return args 
运行 结果 如 下 : 
术 通 过 位 置 传 值 
>>> test args = para_test('Python', 人 工 智能 ') 
>>> print(test_args) 
('Python', ' 人 工 智能 ') 


G) 参数 类 型 为 任意 数量 的 关键 字 参 数 (VAR KEYWORD) 时 ， 即 


**kwargs 参数 ， 只 能 通过 关键 字 传 值 。 


实验 数据 : 

>>> def func test(**args): 
return args 

运行 结果 如 下 : 


# 通 过 关键 字 传 值 

>>> str1 = func_test(test1=123,test2=' 测 试 数据 ') 
>>> print(str1) 

{test1': 123, 'test2": ' 测 试 数据 } 


(4) 参数 类 型 为 仅 关键 字 的 参数 (KEYWORD ONLY) 时 ， 只 能 通过 


关键 字 传 值 。 


实验 数据 : 


>>> def func_test(*args,c,str): 
return (args,c,str) 


* 只 能 通过 关键 字 传 值 

>>> str test = func testzz it 8i java 'R 语言 ',c='480',str='test12') 
>>> print(str test) 

(( 云 计算 ', java', 'R 语言 ), '480', 'test12") 


(5) 参数 类 型 为 仅 位 置 的 参数 (POSITIONAL ONLYO 时 ， 只 能 通过 


位 置 传 值 ， 这 种 形式 常用 在 Python 的 很 多 内 建 的 函数 中 。 
实验 数据 : 


>>> def func_2(x,y): 
return x/y 
运行 结果 如 下 : 
* 只 能 通过 位 置 传 值 
>>> fina_c = func_2(5,8) 
>>> print(fina_c) 
0.625 
# 再 举 一 个 Python 内 建 函 数 的 例子 : 求 x 的 y 次 方 
>>> pow(5,8) 
390625 
>>> pow(8,5) 
32768 
# 交 换 了 位 置 顺序 得 到 了 完全 不 同 的 结果 


6.4.4 ”使 用 闭 包 和 递归 函数 


闭 包 就 是 内 部 函数 使 用 外 部 函数 局 部 变量 的 行为 。 


def multiply(x): 
m=x 
def multiply y(y): 
Ey 
return m*l 
return multiply y 
i = float(input(" 请 输入 乘 数 : ")) 
j = float(input(" 请 输入 被 乘 数 : ")) 
print(' 两 数 相 乘 的 结果 是 :multiply(D)0)) 


运行 结果 如 下 : 


请 输入 乘 数 : 7.5 
请 输入 被 乘 数 : 8.9 
两 数 相 乘 的 结果 是 : 66.75. 


递归 函数 就 是 函数 自我 调用 。 
例如 ， 求 1 到 某 个 正 整数 的 和 。 
实验 数据 : 
deffunc_sum(m): 
if(m--0): 
return 0 


else: 
return m * func sum(m - 1) 
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num=int(input(" 请 输入 要 求 和 的 正 整数 : ")) 
print(func_sum(num)) 

运行 结果 如 下 : 

请 输入 要 求 和 的 正 整 数 : 98 

4851 


6.4.5 使 用 Python 的 内 置 函 数 


Python 的 内 置 函数 通常 是 比较 常用 的 或 者 是 元 操作 ， 通 常 包括 数学 运 
算 类 (除了 加 减 乘除 )、 集合 类 操作 、 逻 辑 操作 、IO 操作 、 反 射 操作 等 类 型 。 

(1) 查看 Python 内 置 的 全 部 变量 和 函数 的 步骤 是 : 打开 IDLE Shell, 
输入 dir( builins ), f£ Enter f£. 

>>> dir builins ) 

['ArithmeticError', 'AssertionError', 'AttributeError', BaseException', 


"BlockinglOError', 'BrokenPipeError', 'BufferError', 'BytesWarning', 
"ChildProcessError', 'ConnectionAbortedError,, ... 


(2) 可 以 用 help C[function 查看 某 个 内 置 函数 的 具体 用 法 及 定义 。 


>>> help(pow) 

Help on built-in function pow in module builtins: 

pow(x, y, z=None, /) 
Equivalent to x**y (with two arguments) or x**y 96 z (with three arguments) 
Some types, such as ints, are able to use a more efficient algorithm when 
invoked using the three argument form. 


(3) 内 置 函数 直接 调用 即 可 。 


如 下 实验 数据 : 
>>> abs(-17.5) # 求 绝对 值 
17.5 
>>> print('Python 3.6.5") # 打 印 函 数 
Python 3.6.5 

65 小结 


定义 函数 时 , 需要 确定 函数 名 和 参数 个 数 ; 函数 体内 用 retum 返回 函数 
结果 ; 函数 没有 retum 语句 或 retum 语句 后 面 为 空 时 ， 自 动 返回 None. FÉ 


数 可 以 同时 返回 多 个 值 。 
默认 值 参 数 一 定 要 用 不 可 变 对 象 ， 如 果 是 可 变 对 象 ， 程 序 运行 时 会 有 


命名 的 关键 字 参 数 是 为 了 限制 调用 者 可 以 传 入 的 参数 名 ， 同 时 可 以 提 
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供 默认 值 。 
使 用 递归 函数 的 优点 是 逻辑 简单 清晰 ， 缺 点 是 过 深 的 调用 会 导致 栈 


习题 

一 、 问 答题 

1. 在 函数 内 部 可 以 通过 什么 关键 字 来 定义 全 局 变量 ? 

2. 如 果 函 数 中 没有 return 语句 或 者 retum 语句 不 带 任何 返回 值 ， 那 么 
该 函数 的 返回 值 是 什么 ? 

二 、 程 序 设计 题 

1. 设计 一 个 程序 ， 用 递归 求解 汉 诺 塔 。 

2. 斐 波 那 契 数列 ,用 递归 算法 求解 。 费 波 那 契 数列 的 数学 定义 是 :F0= 0070): 
Fl=1 (1); Fn- F[nc1]- F[n22] Cn=>2)。 

3. 设计 一 个 函数 ， 实 现 输入 一 个 五 位 数 的 正 整数 〈 程 序 要 对 输入 数据 
4 合法 性 进行 检查 )， 对 输入 的 数据 加 密 后 再 返回 ， 加 密 规 则 : 每 位 数字 都 
加 上 7， 然 后 用 10 取 模 ， 再 将 得 到 的 结果 交换 顺序 : 第 一 位 和 第 二 位 交换 ， 
第 三 位 和 第 五 位 交换 ， 第 一 位 和 第 四 位 交换 。 
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在 第 6 章 我 们 详细 介绍 了 函数 的 使 用 场景 、 调 用 方法 等 ， 然 而 对 于 一 
个 复杂 的 程序 功能 ， 同 时 为 了 编写 可 维护 的 程序 代码 ， 我 们 往往 把 很 多 函 
数 分 组 ， 分 别 放 到 不 同 的 文件 中 ， 这 里 的 每 个 文件 就 是 模块 。Python 提供 
了 方法 可 以 从 模块 中 获取 定义 ,在 程序 脚本 或 者 Shell 解释 器 的 一 个 交互 式 
环境 中 使 用 。 本 章 将 详细 介绍 模块 的 概述 和 使 用 方法 等 。 


7.1 模块 的 概述 


在 Python 中 ， 模 块 (Module) 就 是 更 高 级 的 封装 。 在 前 面 讲解 的 知识 
中 ， 容 器 (元 组 ， 列 表 〉 是 数据 的 封装 ， 函 数 是 语句 的 封装 ， 类 是 方法 和 
属性 的 封装 ， 模 块 就 是 程序 的 封装 。 


7.1.1 ”模块 与 程序 


我 们 写 的 代码 保存 的 以 .py 结尾 的 Python 文件 就 是 一 个 独立 的 模块 , 模 
块 包含 了 对 象 定义 和 语句 。 
代码 如 下 所 示 : 


def fbnc(n): 
result = 1 
result 1 = 1 
result 2 = 1 
ifn«1: 
print( 输 入 有 误 ! ) 


return -1 
while (n-2) > 0: 
result = result 2 + result 1 
result 1 = result 2 
result 2 = result 
n=1 
return result 
number = int(input(' 请 输入 一 个 正 整数 : )) 
result = fbnc(number) 
print("%d 的 斐 波 那 契 数列 是 : %d" 96 (number,result)) 


在 上 例 中 ， 我 们 定义 了 一 个 模块 fgbolacci_ 1， 程序 代码 如 上 例 所 示 。 


上 例 代码 运行 结果 如 下 : 


请 输入 一 个 正 整数 : 13 
13 的 斐 波 那 契 数 列 是 : 233 


从 上 例 代 码 运行 的 结果 看 ， 得 到 了 我 们 期 望 的 运行 结果 。 


由 此 可 见 ， 模 块 就 是 一 个 以 .py 结尾 的 独立 的 程序 代码 的 文件 ， 实 现 了 


特定 的 功能 。 
7.1.2 命名 空间 


命名 空间 是 一 个 包含 了 一 个 或 多 个 变量 名 称 和 它们 各 自 对 应 的 对 象 
的 字典 。 


Python 可 以 调用 局 部 命名 空间 和 全 局 命名 空间 中 的 变量 。 如果 一 个 局 


部 变量 和 一 个 全 局 变量 重 名 ， 则 在 函数 内 部 调用 时 局 部 变量 会 屏蔽 全 


值 


局 


局 


如 果 要 修改 函数 内 全 局 变量 的 值 ， 必 须 使 用 global 语句 ， 否 则 会 出 错 。 


代码 如 下 所 示 : 


Price = 5687 
def SubPrice(): 
Price =Price - 100 
print (Price) 
运行 结果 如 下 : 
>>> SubPrice() 
Traceback (most recent call last): 
File "<pyshell#1>", line 1, in <module> 
SubPrice() 
File "G:/Python/ Modle.py", line 4, in SubPrice 
Price -Price - 100 
UnboundLocalError: local variable 'Price' referenced before assignment 
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在 上 例 中 ， 我 们 定义 了 一 个 名 为 Modle 的 模块 ， 在 模块 全 局 命名 空间 


中 定义 一 个 变量 Price， 并 赋 初 值 5687。 再 在 函数 内 修改 变量 Price 的 值 ， 
然而 Python 会 屏蔽 全 局 变量 Price， 我 们 并 没有 在 访问 前 声明 一 个 局 部 变 
量 Price， 结 果 就 是 会 出 现 一 个 UnboundLocalError 的 错误 。 


在 函数 内 部 用 global 关键 字 对 全 局 变量 Price 重新 定义 ， 代 码 如 下 所 示 : 


Price = 5687 

def SubPrice(): 
global Price 
Price -Price - 100 
print (Price) 


运行 结果 如 下 : 


>>> SubPrice() 
5587 


从 上 例 代码 运行 结果 看 ， 程 序 运行 正确 。 


7.1.3 ”模块 导入 方法 


要 导入 系统 模块 或 者 已 经 定义 好 的 模块 ， 有 以 下 3 种 方法 。 
1. 最 常用 的 方法 
import module 


module 是 模块 名 ， 如 果 有 多 个 模块 ， 模 块 名 称 之 间 用 逗号 “,” 隔 开 。 
导入 模块 后 ， 就 可 以 引用 模块 内 的 函数 ， 语 法 格式 如 下 : 
模块 名 .函数 名 

导入 模块 ， 引 用 模块 的 函数 ， 操 作 程 序 代码 如 下 所 示 : 


>>> import os 
>>> os.getcwd() 
'CXUsersWAdministraton'AppDataWLocalWProgramsWPythonWPython36-32" 
>>> import math,hanshu 
>>> hanshu.area of square(100) 
10100 
>>> help(math) 
Help on built-in module math: 
NAME 
math 
DESCRIPTION 
This module is always available. It provides access to the 
mathematical functions defined by the C standard. 
FUNCTIONS 
acos(...) 


acos(x) 
Return the arc cosine (measured in radians) of x. 

在 上 例 中 ， 我 们 使 用 import 指令 导入 模块 os， 然 后 再 用 os.getcwd() 方 
法 获取 当前 的 目录 。 我 们 同时 导入 了 系统 模块 math 和 自 定义 模块 hanshu。 

注意 事项 : 

(1) 在 IDLE 交互 环境 中 ， 有 一 个 小 技巧 ， 当 输入 导入 的 模块 名 和 点 号 
“.” 之 后 ， 系 统 会 将 模块 内 的 函数 罗列 出 来 供 我 们 选择 。 

(2) 可 以 通过 help (模块 名 ) 查 看 模块 的 帮助 信息 ， 其 中 ，FUNCTIONS 
介绍 了 模块 内 函数 的 使 用 方法 。 

(3) 不 管 执行 了 多 少 次 import， 一 个 模块 只 会 被 导入 一 次 。 

(4) 导入 模块 后 ， 就 可 用 模块 名 称 这 个 变量 访问 模块 的 函数 等 所 有 
功能 。 

2. 第 二 种 方法 

from 模块 名 import 函数 名 

函数 名 如 果 有 多 个 ， 可 用 逗号 “,” 隔 开 。 

函数 名 可 用 通配符 “*” 导 出 所 有 的 函数 。 

这 种 方法 要 慎 用 ， 因 为 导出 的 函数 名 称 容易 和 其 他 函数 名 称 冲突 ， 失 
去 了 模块 命名 空间 的 优势 。 

3. 第 三 种 方法 

import 模块 名 as 新 名 字 

这 种 导入 模块 的 方法 ， 相 当 于 给 导入 的 模块 名 称 重新 起 一 个 别名 ， 便 
于 记忆 ， 很 方便 地 在 程序 中 调用 。 


7.1.4 自 定 义 模 块 和 包 


1. 自 定义 模块 
自 定义 模块 的 方法 和 步骤 如 下 : 
在 安装 Python 的 目录 下 , 新 建 一 个 以 py 为 后 级 名 的 文件 , 然后 编辑 该 
文件 。 
代码 如 下 所 示 : 
def area_of_square(x): 
S-x*x-* 100 
return s 
在 上 例 中 定义 了 一 个 函数 ， 实 现 的 功能 是 : 计算 正 整数 的 平方 ， 再 加 
上 100。 我 们 新 建 的 Python 文件 名 是 hanshu.py。 
调用 模块 的 过 程 如 下 所 示 : 
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>>> import hanshu 

>>> hanshu.area of square(99) 

9901 

在 上 例 中 ， 用 import 导入 模块 hanshu， 然 后 调用 模块 里 定义 的 函数 
hanshu.area of square(99)， 最 后 函数 运行 得 到 了 正确 的 结果 9901. 

在 自 定义 模块 时 ， 有 以 下 几 点 要 注意 。 

(1) 为 了 使 IDLE 能 找到 自 定义 模块 , 该 模块 要 和 调用 的 程序 在 同一 目 
录 下 ， 否 则 在 导入 模块 时 会 提示 找 不 到 模块 的 错误 。 

(2) 模块 名 要 遵循 Python 变量 命名 规范 ,不 要 使 用 中 文 、 特 殊 字 符 等 。 

(3) 自 定义 的 模块 名 不 要 和 系统 内 置 的 模块 名 相同 ， 可 以 在 IDLE 交 
互 环境 中 先 用 import modle name 命令 检查 , 若 成 功 则 说 明 系 统 已 存在 此 模 
块 ， 然 后 考虑 更 改 自 定义 的 模块 名 。 

2. 自 定义 包 

在 大 型 项 目 开 发 中 ， 有 多 个 程序 员 协 作 共同 开发 一 个 项 目 ， 为 了 避免 
模块 名 重 名 ，Python 引入 了 按 目录 来 组 织 模块 的 方法 ， 称 为 包 (Package). 
包 是 一 个 分 层级 的 文件 目录 结构 ， 它 定义 了 由 模块 及 子 包 ， 以 及 子 包 下 的 
子 包 等 组 成 的 命名 空间 。 

例如 ，test modlel.py 的 文件 就 是 名 字 叫 test modlel 的 模块 ， 
test modle2.py 的 文件 就 是 名 字 叫 test modle2 的 模块 。 假 如 test_modlel 和 
test modle2 这 两 个 模块 名 称 与 其 他 的 模块 名 称 相 同 了 ， 可 以 通过 包 来 组 织 
模块 ， 避 免 冲突 。 解 决 方法 是 选择 一 个 顶层 包 名 ， 如 mymodle， 按 照 下 面 
的 目录 存放 : 

mymodle 

į . init .py 

I— test modle1.py 

L— test modle2.py 

在 上 例 中 ，test_ modlel.py 模块 的 名 字 就 变 成 了 mymodle.test modlel, 
同 理 ，test_ modle2.py 的 模块 名 变 成 了 mymodle. test modle2。 在 Python 中 
引入 包 之 后 ， 只 要 顶层 的 包 名 不 与 其 他 人 重 名 ， 那 所 有 模块 都 不 会 与 他 人 
冲突 。 

在 自 定义 包 时 ， 需 要 注意 以 下 几 点 。 

COD 每 个 包 目 录 下 面 都 会 有 一 个 _init_.py 的 文件 , 这 个 文件 是 必须 存 
在 的 ， 和 否则， 系统 就 把 这 个 目录 作为 普通 目录 ， 而 不 是 一 个 包 。 

(2) init py 可 以 是 空 文件 ， 也 可 以 有 Python 代码 , 因为 _init py 
就 是 一 个 模块 ， 而 它 的 模块 名 就 是 mymodle。 

G) 在 Python 中 可 以 有 多 级 目录 ， 组 成 多 层次 的 包 结 构 。 如 下 面 所 示 
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的 目录 结构 : 


Mymodle 
I— Site 
|. L— . init py 
| [— modle.py 
| “上 一 test_modle1.py 


| init .py 
L— test modle1.py 
文件 modle.py 的 模块 名 就 是 Mymodl.Site. modle, 两 个 文件 test modlel. 
py 的 模块 名 分 别 是 Mymodl.Site.test modlel 和 Mymodl.test_ modlel 。 
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安装 第 三 方 模块 ， 是 通过 包 管 理工 具 pip 来 实现 的 。 
本 节 以 Win 10 操作 系统 ，Python 3.6.5 安装 为 例 ， 确 保安 装 时 选中 pip 
和 Add Python to environment variables 复 选 框 ， 如 图 7.1 和 图 7.2 所 示 。 


[E> Python 365 (32-bit) Setup E: x 


J Optional Features 
E Documentation 


fhon docimen 


回 pp 
nstalls p n download and inst. : 
Ed td/tk and IDLE 


ter and the IDLE development env 


EZ Python test suite. 


python 
for 
windows Back Net || Cancel 
图 7.1 选中 pip 复 选 框 
f» Python 3.6.5 (32-bit) Setup. - x 


J Advanced Options 
nstall for all users 


E Associate files with Python (requires the py launcher) 


Create shortcuts for installed applications 
EZ Add Python to environment variables. 
EZ Precompile standard library 


E Download debugging symbols 
E Download debug binaries (requires VS 2015 or later) 


Customize install location. 
CAUsersAdministrator AppData\LocaN\Programs\Python\pyt RR 


py 
for 
windows Bak kin 7] pea 


图 7.2 选中 Add Python to environment variables 复 选 框 
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选择 “开始 ”一 “运行 ”命令 ， 在 弹出 的 对 话 框 中 输入 cmd 命令 或 者 
直接 选中 “命令 提示 符 ” 出 现 如 图 7.3 所 示 的 提示 。 


— menm 
命令 提示 符 


图 7.3 命令 提示 符 窗口 


pip 命令 格式 如 下 : 


pip <command> [options] 


Commands: 
install Install packages. 
download Download packages. 
uninstall Uninstall packages. 
freeze Output installed packages in requirements format. 


安装 第 三 方 模块 前 的 项 如 下 。 

(1) 确保 可 以 从 命令 提示 符 中 的 命令 行 运行 Python。 

请 确保 安装 了 Python， 并 且 预 期 的 版 本 可 以 从 命令 行 获得 ， 可 以 通过 
运行 以 下 命令 来 检查 : 


python --version 
运行 结果 如 下 : 
Ci:\Users\Administrator>python --version 
Python 3.6.5 
(2) 确保 可 以 从 命令 行 运行 pip。 
此 外 ， 还 需要 确保 系统 有 pip 可 用 ， 可 以 通过 运行 以 下 命令 来 检查 : 
pip -version 
运行 结果 如 下 : 
C:\Users\Administrator>pip --version 
pip 10.0.1 from c:\users\administrator\appdata\local\programs\python\ 
python36-32Vibsite-packagespip (python 3.6 
(3) 确保 pip、setuptools 和 wheel 是 最 新 的 。 
虽然 pip 单独 地 从 预 构 建 的 二 进 制 文件 中 安装 即 可 ， 但 是 最 新 的 
setuptools 和 wheel 的 版 本 对 于 确保 可 以 从 源 文件 中 安装 是 有 用 的 。 可 以 运 
行 以 下 命令 : 


python -m pip install upgrade pip setuptools wheel 
运行 成 功 后， 会 有 如 下 提示 信息 : 
Successfully installed pip-10.0.1 setuptools-39.2.0 wheel-0.31.1 


(4) 创建 一 个 虚拟 环境 ， 此 项 仅 用 于 Linux 系统 ， 为 可 选项 。 运行 以 下 
命令 : 


python3 -m venv tutorial env 
source tutorial env/bin/activate 


上 述 命令 将 在 tutorial env 子 目录 中 创建 一 个 新 的 虚拟 环境 ， 并 配置 当 
前 shell 以 将 其 用 作 默 认 的 Python 环境 。 

有 关 更 多 虚拟 环境 配置 的 信息 , 请 参见 Python 官方 的 virtualenv 文档 或 
venv 文档 。 

本 节 仅 以 从 PyPI 安装 为 例 ， 其 他 安装 方式 请 查阅 相关 资料 。 

使 用 pip 从 PyPI 安装 : pip 最 常用 的 用 法 是 从 Python 包 索 引 中 使 用 需 
求 说 明 符 来 安装 。 一 般 来 说 ， 需 求 说 明 符 由 项 目 名 称 和 版 本 说 明 符 组 成 。 

在 Python 官网 https://www.pypi.org 可 以 查询 、 注 册 发 布 的 第 三 方 库 ， 
包括 包 的 历史 版 本 号 、 支 持 的 应 用 环境 等 包 信息 。 

以 安装 web 模块 为 例 : 

(1) 在 Python 官网 查询 web， 得 到 包 的 名 称 是 web3， 最 新 版 本 号 是 
4.3.0。 在 命令 提示 符 下 输入 以 下 命令 : 

pip install web3==4.3.0 

系统 自动 会 从 Python 官网 下 载 文 件 ， 进 行 安装 。 

在 安装 过 程 中 ， 有 的 系统 环境 也 许 会 出 现 以 下 错误 提示 : 

error: Microsoft Visual C++ 14.0 is required. Get it with "Microsoft 

Visual C++ Build Tools": http://landinghub.visualstudio.com/ 

visual-cpp-build-tools 

解决 办 法 是 : 

下 载 visualcppbuildtools_fullexe， 安 装 即 可 。 

2) 升级 包 。 

将 已 安装 的 项 目 升级 到 PyPI 的 最 新 项 目 ， 需 运行 以 下 命令 : 

pip install --upgrade web3 


(3) 安装 到 用 户 站 点 。 
若 要 安装 与 当前 用 户 隔 离 的 包 ， 请 使 用 用 户 标志 ， 需 运行 以 下 命令 : 


pip install --user SomeProject 


安装 需求 文件 中 指定 的 需求 列表 ， 如 果 没 有 则 忽略 。 需 运行 以 下 命令 : 
pip install -r requirements.txt 


(5) 在 Python shell 环境 中 验证 安装 的 第 三 方 模块 。 
在 IDLE Shell 交互 环境 下 使 用 import 命令 ， 如 下 所 示 : 


>>> import web3 
运行 结果 如 下 : 


>>> dir(web3) 

[Account, 'EthereumTesterProvider', 'HTTPProvider', 'IPCProvider', 
"TestRPCProvider, "Web3', "WebsocketProvider, ' all ', ' Pbuiltins ', 
' cached ', ' doc ',' file ', ' loader ', ' name ', ' package ', 
' path ',' spec ',' version ','admin', 'contract, 'eth', 'exceptions', 'iban', 
'main', 'manager, 'middleware', 'miner', 'module', 'net', 'parity', 'personal', 
'pkg. resources", 'providers', 'sys', 'testing', 'txpool', 'utils', version] 


从 以 上 运行 结果 可 以 看 出 ， 第 三 方 模块 web 已 成 功 安装 。 


7.3 ”模块 应 用 实例 
7.3.1 日 期 时 间 相 关 : datetime 模块 


datetime 是 Python 处 理 日 期 和 时 间 的 标准 模块 。 
1. 获取 当前 日 期 和 时 间 

代码 如 下 例 所 示 : 

>>> from datetime import datetime 

>>> now = datetime.now() # 获取 当前 datetime 
运行 结果 如 下 : 


>>> print(now) 

2018-06-19 13:07:58.726038 
>>> print(type(now)) 

«class 'datetime.datetime' 


从 上 例 可 以 看 出 ，datetime 是 模块 ，datetime 模块 还 包含 一 个 datetime 


类 ,通过 from datetime import datetime 导入 的 才 是 datetime 这 个 类 。 如 果 仅 
导入 import datetime， 则 必须 引用 全 名 datetime.datetime. datetime.now()j& 


回 


uz 


前 日 期 和 时 间 ， 其 类 型 是 datetime。 


2. 获取 指定 日 期 和 时 间 
代码 如 下 所 示 : 


>>> from datetime import datetime 

>>> dt = datetime(2018, 6, 19, 13, 15) # 用 指定 日 期 时 间 创 建 datetime 

运行 结果 如 下 : 

>>> print(dt) 

2018-06-19 13:15:00 

3. datetime 转换 为 timestamp 

在 计算 机 中 ， 时 间 实 际 上 是 用 数字 表示 的 。 我 们 把 1970 年 1 月 1 日 
00:00:00 UTC+00:00 时 区 的 时 刻 称 为 epoch time， 记 为 0 (1970 年 以 前 的 时 
间 timestamp 为 负数 )， 当 前 时 间 就 是 相对 于 epoch time 的 秒 数 ， 称 为 
timestamp. 

可 以 认为 : 

timestamp = 0 = 1970-1-1 00:00:00 UTC+0:00 

对 应 的 北京 时 间 是 : 

timestamp = 0 = 1970-1-1 08:00:00 UTC+8:00 


可 见 timestamp 的 值 与 时 区 毫 无 关系 , 因为 timestamp 一 旦 确定 ,其 UTC 
对 间 就 确定 了 ， 转 换 到 任意 时 区 的 时 间 也 是 完全 确定 的 ， 这 就 是 为 什么 计 
算 机 存储 的 当前 时 间 是 以 timestamp 表示 的 , 因为 全 球 各 地 的 计算 机 在 任意 
寺 刻 的 timestamp 都 是 完全 相同 的 。 
把 一 个 datetime 类 型 转换 为 timestamp 只 需要 简单 调用 timestamp() 方 
代码 如 下 所 示 : 
>>> from datetime import datetime 
>>> dt = datetime(2018, 6, 19, 13, 15) # 用 指定 日 期 时 间 创 建 datetime 
运行 结果 如 下 : 
>>> dttimestamp() # 把 datetime 转换 为 timestamp 
1529385300.0 
需要 注意 的 是 ，Python 的 timestamp 是 一 个 浮 点 数 。 如 果 有 小 数位 ， 小 
数位 表示 毫秒 数 。 某 些 编程 语言 (如 Java 和 JavaScript) 的 timestamp 使 用 
整数 表示 毫秒 数 ， 这 种 情况 下 只 需要 把 timestamp 除 以 1000 就 得 到 Python 
的 浮 点 表示 方法 。 

4. timestamp 转换 为 datetime 

要 把 timestamp 转换 为 datetime, 使 用 datetime 提供 的 fromtime stamp() 
方法 ， 代 码 如 下 所 示 : 


>>> from datetime import datetime 


法 
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>>> t = 1529385300.0 
运行 结果 如 下 : 


>>> print(datetime.fromtimestamp(t)) 
2018-06-19 13:15:00 


从 上 例 可 以 看 出 ，timestamp 是 一 个 浮 点 数 ， 它 没有 时 区 的 概念 ， 而 


datetime 是 有 时 区 的 。 上 述 转换 是 在 timestamp 和 本 地 时 间 做 转换 。 


本 地 时 间 是 指 当 前 操作 系统 设 定 的 时 区 。 
timestamp 也 可 以 直接 被 转换 到 UTC 标准 时 区 的 时 间 ， 使 用 datetime 


提供 的 utcfromtimestamp() 方 法 ， 代 码 如 下 所 示 : 


>>> from datetime import datetime 

>>> t = 1529385300.0 

运行 结果 如 下 : 

>>> print(datetime.fromtimestamp(t)) # 本 地 时 间 

2018-06-19 13:15:00 

>>> print(datetime.utcfromtimestamp(t)) # UTC 时 间 

2018-06-19 05:15:00 

5. str 转换 为 datetime 

用 户 输入 的 日 期 和 时 间 是 字符 串 ， 要 处 理 日 期 和 时 间 ， 首 先 必须 把 str 


转换 为 datetime, 转换 方 法 是 通过 datetime 提供 的 strptime() 方 法 来 实现 , 代 


码 如 下 所 示 : 
>>> from datetime import datetime 
>>> datee test = datetime.strptime('2018-06-19 13:15:00", 
"96 Y-96m-96d 96H:96M:96S") 
运行 结果 如 下 : 


式 。 


>>> print(datee_test) 

2018-06-19 13:15:00 

在 上 例 中 ,字符 串 '%Y-%m-%d %H:%M:%S' 规 定 了 日 期 和 时 间 部 分 的 格 
转换 后 的 datetime 是 没有 时 区 信息 的 。 

6. datetime 转换 为 str 

如 果 已 经 有 了 datetime 对 象 ， 要 把 它 格式 化 为 字符 串 显示 给 用 户 ， 就 


需要 转换 为 str， 转 换 方法 是 通过 datetime 提供 的 strftime() 方 法 实现 的 ， 代 
码 如 下 例 所 示 : 


>>> from datetime import datetime 
>>> now = datetime.now() 


运行 结果 如 下 : 

>>> print(now.strftime('%a, %b %d %H:%M')) 

Tue, Jun 19 13:07 

7. datetime 加 减 

对 日 期 和 时 间 进 行 加 减 ， 实 际 上 就 是 把 datetime 往 后 或 往 前 计算 ， 得 
到 新 的 datetime。 加 减 可 以 直接 用 + 和 -运算 符 ， 需 要 导入 timedelta 类 ， 代 
码 如 下 所 示 : 

>>> from datetime import datetime, timedelta 

>>> now = datetime.now() 

运行 结果 如 下 : 


>>> now 

datetime.datetime(2018, 6, 19, 14, 42, 36, 664596) 
>>> now + timedelta(hours-10) 
datetime.datetime(2018, 6, 20, 0, 42, 36, 664596) 
>>> now - timedelta(days-10) 
datetime.datetime(2018, 6, 9, 14, 42, 36, 664596) 
>>> now + timedelta(days-12, hours-23) 
datetime.datetime(2018, 7, 2, 13, 42, 36, 664596) 


从 上 例 可 见 , 使 用 timedelta 可 以 很 容易 地 算出 前 几 天 和 后 几 天 的 时 刻 。 

8. 本 地 时 间 转 换 为 UTC 时 间 

本 地 时 间 是 指 系统 设 定时 区 的 时 间 , 例如 北京 时 间 是 UTC+8:00 时 区 的 
时 间 ， 而 UTC 时 间 指 UTC+0:00 时 区 的 时 间 。 

datetime 类 型 有 时 区 属性 tzinfo， 默 认为 None， 所 以 无 法 区 分 这 个 
datetime 到 底 是 哪个 时 区 ， 除 非 强行 给 datetime 设置 一 个 时 区 ， 代 码 如 下 
所 示 : 

>>> from datetime import datetime, timedelta, timezone 

>>> utc 8 = timezone(timedelta(hours=8)) # 创建 时 区 UTC+8:00 

>>> now = datetime.now() 

运行 结果 如 下 : 


>>> now 

datetime.datetime(2018, 6, 19, 15, 20, 8, 373839) 

>>> dt_test = now.replace(tzinfo=utc_8) # 强制 设置 为 UTC+8:00 

>>> dt test 

datetime.datetime(2018, 6, 19, 15, 20, 8, 373839, tzinfo-datetime.timezone(dat 
etime.timedelta(0, 28800))) 


从 上 例 可 以 看 出 ， 如 果 系 统 时 区 恰好 是 UTC+8:00， 那 么 上 述 程序 代码 
正确 ， 否 则 ， 不 能 强制 设置 为 UTC+8:00 时 区 。 
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9. 时 区 转换 

先 通过 datetime 提供 的 utcnow0 方 法 拿 到 当前 的 UTC 时 间 ， 再 用 
astimezone() 方 法 转换 为 任意 时 区 的 时 间 ， 如 下 所 示 。 

获取 UTC 时 间 ， 并 强制 设置 时 区 为 UTC+0:00， 代 码 如 下 所 示 : 

>>> utc dtime = datetime.utcnow().replace(tzinfo-timezone.utc) 

运行 结果 如 下 : 

>>> print(utc dtime) 

2018-06-19 07:27:27.0853134*00:00 


将 转换 时 区 为 北京 时 间 ， 代 码 如 下 所 示 : 
>>> bj dtime = utc_dt.astimezone(timezone(timedelta(hours=8))) 
运行 结果 如 下 : 


>>> print(bj_dtime) 
2018-06-19 15:27:27.085313+08:00 


从 上 例 可 见 ， 时 区 转换 的 关键 在 于 得 到 datetime 时 间 ， 要 获知 其 正确 
的 时 区 ， 然 后 强制 设置 时 区 ， 作 为 基准 时 间 。 利 用 带 时 区 的 datetime， 通 过 
astimezone() 方 法 ， 可 以 转换 到 任意 时 区 。 


7.3.2 读 写 JSON 数据 : json 模块 


JSON (JavaScript Object Notation) 是 一 种 轻 量 级 的 数据 交换 格式 。 
JSON 的 数据 格式 等 同 于 Python 里 面 的 字典 格式 ， 里 面 可 以 包含 方 括号 括 
起 来 的 数组 ， 即 Python 里 面 的 列表 。 

在 Python 中 ，json 模块 专门 处 理 json 格式 的 数据 ， 提 供 了 4 种 方法 : 
dumps(). dump(). loads(). load(). 

1. dumps(). dump() 

dumps0、dumpO 实 现 序列 化 功能 ， 但 在 使 用 功能 上 有 差别 。 其 中 ， 
dumpsO 实 现 的 是 将 数据 序列 化 为 字符 串 〈str)， 而 在 使 用 dump0 时 ， 必 须 
传 文件 描述 符 ， 将 序列 化 的 字符 串 (str) 保存 到 文件 中 。 

dumps0 方 法 的 使 用 如 下 所 示 : 

>>> import json 

运行 结果 如 下 : 

>>> json.dumps('Python') # 字 符 串 


Python 
>>> json.dumps(12.78) # 数 字 


12.78 


»»»dict test = ("teacher name"""Mr.Liu","teach age":18)4z8& 
>>> json.dumps(dict, test) # 字 典 
"l'teacher. name": "Mr.Liu", "teach. age": 18) 
在 上 例 中 ，dumps 将 数字 、 字 符 串 、 字 和 典 等 数据 序列 化 为 标准 的 字符 
tB (str) X. 
dump() 方 法 的 使 用 如 下 所 示 : 
import json 
dict test = ("teacher name""Mr.Liu","teach age":18) 
with open("G:Wson test.json","w",encoding-'utf-8") as file test: 
json.dump(dict test/file test,indent-4) 
在 上 例 中 ， 使 用 dump() 方 法 将 字典 数据 dict test 保存 到 G 盘 根 目录 下 
的 json testjson 文件 中 。 运 行 后 的 效果 如 下 所 示 : 
( 
"teacher name": "Mr.Liu", 
"teach age": 18 
) 
2.loads(). load() 
loads0、1load0 是 反 序 列 化 方法 。loadsO 只 完成 了 反 序 列 化 ，loadO 只 
收文 件 描述 符 ， 完 成 了 读 取 文件 和 反 序 列 化 。 
loads() 方 法 的 使 用 如 下 所 示 : 
>>> import json 
>>> json.loads('{"teacher_name":"Mr.Liu","teach_age":18}') 
运行 结果 如 下 : 
(teacher name": 'Mr.Liu', teach age' 18) 


在 上 例 中 ,loads 将 已 经 序列 化 的 字典 字符 串 数 据 反 序列 化 为 字典 数据 。 
load() 方 法 的 使 用 如 下 所 示 : 


import json 
with open("G:\\json_test.json", "r", encoding-'utf-8') as file test: 
test loads = json.loads(file test.read()) 
file test.seek(0) 
test load = json.load(file test) # [s] json.loads(file test.read()) 
print(test loads) 
print(test load) 


在 上 例 中 ，load 将 已 经 序列 化 的 文件 的 字典 字符 串 数 据 反 序列 化 为 字 
典 数 据 ，loads() 实 现 了 和 load0 一 样 的 功能 。 运 行 结果 如 下 所 示 : 


{teacher_name': 'Mr.Liu', teach age': 18} 
(teacher name*: 'Mr.Liu', teach age": 18) 
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7.83.8 系统 相关 : sys 模块 


sys 模块 是 Python 自 带 模块 , 包含 了 和 系统 相关 的 信息 。 通 过 运行 以 下 
命令 ， 导 入 该 模块 ， 代 码 如 下 所 示 : 


>>> import sys 

通过 help (sys) 或 者 dir (sys) 命令 查看 sys 模块 可 用 的 方法 ， 代 码 如 
下 所 示 : 

>>> dir(sys) 

运行 结果 如 下 : 

[_displayhook ',' doc ',' excepthook ',' interactivehook ',' loader ', 

' name ^',' package ',' spec ^',' sidem ^',' stdin ^", ' stdout ', 

' clear type cache', ' current frames', ' debugmallocstats', 


' enablelegacywindowsfsencoding',...... ] 

以 上 命令 显示 了 sys 模块 可 用 的 方法 。 

下 面 列 举 sys 模块 常用 的 几 种 方法 。 

(1) sys.path: 包含 输入 模块 的 目录 名 列表 。 

运行 命令 ， 代 码 如 下 所 示 : 

>>> sys.path 

运行 结果 如 下 : 

[G/Python 教 材 编 5 / 例 - 20180619 例 子 ， 
'C:\Users\Lenovo\AppData\\Local\Programs\\Python\Python36-32\\Lib\\idlelib 


CANUsersNLenovowAppDataNLocalNProgramsNPythonNPython36-32Npython36.。 

zip", 'CUsersWLenovoWAppDataWLocalWProgramsWPythonWPython36-32WDLLs', 

'CWUsersWLenovoWAppDataWLocalWProgramsWPythonWPython36-32Wib', 

'CNUsersWLenovoWAppDataWLocalMProgramsWPythonWP ython36-32', 

'CXUsersWLenovoWAppDataWLocalWProgramsWPythonWPython36-32WibWsite-p 

ackages'] 

从 上 面 的 运行 结果 可 以 看 出 ， 该 命令 获取 了 指定 模块 搜索 路 径 的 字符 
串 集合 。 将 写 好 的 模块 放 在 得 到 的 某 个 路 径 下 ， 就 可 以 在 程序 中 导入 时 正 
确 找 到 。 在 import 导入 模块 名 时 ， 就 是 根据 sys.path 的 路 径 来 搜索 模块 名 ， 
也 可 以 用 命令 syspath.append〈 自 定义 模块 路 径 ) 添加 模块 路 径 。 

(2) sysargv: 在 外 部 向 程序 内 部 传递 参数 。 

运行 该 命令 ， 代 码 如 下 所 示 : 

>>> sys.argv 

运行 结果 如 下 : 


[G/Python 教材 编写 /例子 20180619/8]-T-/json load test.py'] 
从 上 面 的 运行 结果 可 以 看 出 , sys.argv 变量 是 一 个 包含 了 命令 行 参 数 的 


字符 串 列 表 , 利用 命令 行 向 程序 传递 参数 。 其中, 脚本 的 名 称 是 sys.argv 列 
表 的 第 一 个 参数 。 


7.3.4 数学 : math 模块 


math 模块 是 Python 自 带 模块 ， 包 含 了 和 数学 运算 公式 相关 的 信息 。 通 


过 运行 以 下 命令 ， 导 入 该 模块 ， 代 码 如 下 所 示 : 


>>> import math 

通过 dir (math) 命令 查看 math 模块 可 用 的 方法 ， 例 如 : 

>>> dir(math) 

运行 结果 如 下 : 

[. doc ',' loader ',' name ',' package ',' spec__','acos', 'acosh', 
'asin', 'asinh', 'atan', 'atan2', 'atanh', 'ceil', 'copysign', 'cos', 'cosh', 'degrees', 'e', 
'erf', 'erfc', 'exp', 'expm1', 'fabs', 'factorial', 'floor', 'fmod', 'frexp', 'fsum', 'gamma', 
'gcd', 'hypot', 'inf', 'isclose', 'isfinite', 'isinf, 'isnan', "Idexp', 'lgamma', 'log', 'log10', 
'"log1p', 'log2', 'modf', 'nan', 'pi', 'pow', 'radians', 'sin', 'sinh', 'sqrt', 'tan', 'tanh', 'tau', 
"trunc'] 

上 面 的 运行 结果 显示 了 math 模块 可 用 的 函数 ， 常 用 的 函数 如 表 7.1 所 示 。 


表 7.1 math 模块 常用 函数 列表 


Eo 说 明 示 例 
" >>> math.e 
math.e 自然 常数 e 
2.718281828459045 
>>> math.pi 
math pi 圆周 率 pi P 
3.141592653589793 
>>> math.d: 2.7 
math.degrees(x) 弧度 转 度 ee) 
154.6986046853223 
>>> math.radians(90) 
math.radians(x) 度 转 弧 度 O 
1.5707963267948966 
"- * >>> th. T 
math.exp(x) 返回 e 的 x 次 方 NO 
1096.6331584284585 
>>> math.expm1(7 
math.expml(x) 返回 e 的 x 次 方 减 1 p(n) 
1095.6331584284585 
返回 x 的 以 base 为 底 的 对 数 ， | >>> math log(7.34) 
math.log(x[, base]) A 
base 默认 为 e 0.5518182657364911 


Eu 说 HB zm 例 
: "E ' th.log10(9 
math logl0(x) 返回 x 的 以 lo 为 底 的 对 数 | > mathJogl0(9) 
0.9542425094393249 
- m" ith.log1p(9' 
math.loglp(x) 返回 1+x 的 自然 对 数 (以 e 为 底 ) | 一 > mathloglp(9) 
2.302585092994046 
th pow(10,12 
math.pow(x, y) 返回 x 的 y 次 方 zo math pow(10,12) 
1000000000000.0 
.sqrt(35 
math.sqrt(x) 返回 x 的 平方 根 el) 
5.916079783099616 
: " >>> math.ceil(7.6. 
math.ceil(x) 返回 不 小 于 x 的 整数 17 aeo) 
en 3 - >> th. floor(9.3 
math floor(x) 返回 不 大 于 x 的 整数 undo 
jä " >>> math.trunc(19.82 
math trunc(x) 返回 x 的 整数 部 分 is Eo) 
>>> math.modf(11.47) 
math.modf(x) 返回 x 的 小 数 和 整数 (0.47000000000000064， 
11.0 
- : th.fabs(-48.5 
math.fabs(x) 返回 x 的 绝对 值 PUN ) 
48.5 
es th.fmod(45,10 
math.fmod(x, y) 返回 x%y WR) io Eg iod ) 
math.fsum([x, 返回 无 损 精度 的 和 >>> math.fsum([1,3.6,7.8]) 
12.4 
S th. factorial(6 
math.factorial(x) 返回 x 的 阶乘 s ath inetonial(6) 
ih.isinf(x) 确保 参数 是 否 为 无 穷 。 若 x 为 无 | >>> math.isinf(45664987.98) 
RR 穷 大 , 返回 Tme; 否则 返回 False | False 


, 若 x 不 是 数字 , 返回 True; 否则 | >>> math.isnan(9.6) 
math.isnan(x) el 
返回 False False 
T xv AS Hh dz th.hypot(3,4 
mabhypo(,y) | 返回 以 x 和 y Juke | -me 


math.copysign(x, y) 


若 y<0, 返 回 -1 乘 以 x 的 绝对 值 ; 


>>> math.copysign(-17.8, -0.5) 
717.8 


否则 返回 x 的 绝对 值 >>> math copysign(-17.8.0.5) 
17.8 
idis 返回 m 和 ji HE x EF mÆ | >>> math.frexp(7) 
math.frexp(x) 2 的 i 次 方 (0.875. 3) 
mathldexp(m,i) ”| 32E] m FLA 2 的 i 次 方 Rd math.dexp(8,2) 
math.sin(x) 返回 x 弧度) 的 三 角 正 弦 值 >>> math.sin(90) 


0.8939966636005579 


续 表 
函数 说 明 示例 
>>> math.asin (1) 
math.asin(x) 返回 x 的 反 三 角 正 弦 值 PEE AR 
1.5707963267948966 
. >>> math.cos(180) 
.cos(5 反 ( ) M) fs 
math.cos(x) 返回 x (弧度 ) 的 三 角 余 弦 值 _0 5984600690578581 
th. 0.5 
math.acos(x) 返回 x 的 反 三 角 余弦 值 een) 
1.0471975511965979 
s —€——M >>> math.tan(90) 
ý Hx ) f — faiEU 
wb) bx ORBO BEAIEUM.. | 955200412208242 
E th.atan(7 
math.atan(x) 返回 x 的 反 三 角 正 切 值 sor na) 
1.4288992721907328 
x — >> th.atan2(2,5 
math.atan2(x, y) 返回 x/y 的 反 三 角 正 切 值 7 math ton2(,3) 
0.3805063771123649 
: . >>> math.sinh(15 
math.sinh(x) 返回 x 的 双 曲 正弦 值 mes) 
1634508.6862359024 
math.asinh(x) 返回 x 的 反 双 曲 正 弦 值 人 
5.192987713658941 
" siii th.cosh(234 
math.cosh(x) 返回 x 的 双 曲 余弦 值 he 中 (3 人 
2.1080396231041644e+101 
p : ith.acosh(32 
math.acosh(x) 返回 x 的 反 双 曲 余弦 值 Sm 
4.158638853279167 
di - ith.tanh(1.6 
math.tanh(x) 返回 x 的 双 曲 正切 值 Sat ny 
0.9216685544064713 
a zs _ >>> math.atanh(0.6 
math.atanh(x) 返回 x 的 反 双 曲 正切 值 2 
0.6931471805599453 
" | >>> math.erf(9 
math.erf(x) 返回 x 的 标准 正 态 分 布 中 的 误差 ito math.erf(9) 
返回 x 的 标准 正 态 分 布 中 的 余 | >>> math.erfc(91.4) 
math.erfc(x) Apos 
误差 0.0 
th.gamma(7 
math.gamma(x) 返回 x 的 伽 玛 值 dim n 
720.0 
返回 x 的 绝对 值 的 自然 对 数 的 | >>> math.lgamma(987) 
math.lgamma(x) 
(nsa 5815.511016865267 


7.3.5 随机 数 : random 模块 


Iandom 模块 是 Python 自 带 模块 ， 功 能 是 生成 随机 数 。 通 过 运行 以 下 命 


令 ， 导 入 该 模块 : 


>>> import random 


z 


通过 dir (random) 命 令 查看 random 模块 可 用 的 方法 ， 运 行 如 下 命令 : 


>>> dir(random) 


运行 结果 如 下 : 

[BPF', 'LOG4A', 'NV MAGICCONST', 'RECIP. BPF; 'Random', 
'SG MAGICCONST,,  'SystemRandom'  'TWOP/!',  ' BuiltinMethodType', 
' MethodType',' Sequence',' Set," all ',' builtins ',' cached /;,...... ] 


下 面 列 举 random 模块 部 分 常用 的 方法 。 
(1) 生成 随机 整数 : randint(). 
运行 以 下 代码 ， 得 到 如 下 结果 : 

>>> random.randint(10,2390) 

1233 


需要 注意 的 是 ， 上 例 用 于 生成 一 个 指定 范围 内 的 整数 ， 其 中 下 限 必 须 


小 于 上 限 ， 否 则 ， 程 序 会 报错 ， 如 下 例 所 示 的 代码 : 


>>> random.randint(20,10) # 下 限 20 > 上 限 10 
Traceback (most recent call last): # 以 下 是 错误 提示 信息 
File "<pyshell#70>", line 1, in <module> 
random.randint(20, 10) 

File 
"CAUsers.LenovoAppData ocalPrograms Python Python36-32Vibirandom.py", 
line 221, in randint 

return self.randrange(a, b+1) 

File 
"CAUsersLenovo'AppDataLocalPrograms Python Python36-32NVibYrandom.py", 
line 199, in randrange 

raise ValueError("empty range for randrange() (%d,%d, 9d)" 96 (istart, istop, 
width)) 
ValueError empty range for randrange() (20,11, -9) 


(2) 生成 随机 浮 点 数 : random()。 
运行 以 下 代码 ， 得 到 如 下 结果 : 

>>> random.random() # 不 带 参 数 
0.47203863107027433 

>>> random.uniform(35, 100) # 带 上 限 ， 下 限 参数 
78.02991602825188 

>>> random.uniform(350, 100) 
232.2659504153889 

从 上 例 的 运行 结果 可 见 ， 生 成 随机 浮 点 数 时 ， 下 限 可 以 大 于 上 限 。 
(3) 随机 字符 : choice。 

运行 以 下 代码 ， 得 到 如 下 结果 : 


>>> random.choice(98&(g)!-gho^') 
g 

(4) Pih: shuffle). 

运行 以 下 代码 : 

>>> test shuffle = ['A''Q',1,6,7,9] 
>>> random.shuffle(test shuffle) 
运行 结果 如 下 : 


>>> test_shuffle 
[7, 6, 1, 'A', 'Q', 9] 
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在 Python 中 调用 R 语言 的 前 提 条 件 是 要 在 本 机 安装 rpy2 模块 和 R 语 
言 工具 。 


7.4.1 安装 rpy2 模块 


Python 调用 R 的 模块 是 rpy2。 

安装 时 注意 rpy2 的 版 本 和 python 的 版 本 要 对 应 ， 也 要 和 OR 的 版 本 
对 应 。 以 本 Python 版 本 为 例 : Python 3.6.5 (v3.6.5:f59c0932b4, Mar 28 2018, 
16:07:46) [MSC v.1900 32 bit (Intel)] on win32， 操 作 步 又 如 下 : 

(OD 下 载 py2。 

下 载 链接 地 址 : http://www.lfd.uci.edu/~gohlke/pythonlibs/#rpy2。 

选择 下 载 Ipy2-2.9.4-cp36-cp36m-win32.whl， 对 应 python3.6.5 H. 32 位 
版 本 。 

(2) 安装 。 

在 命令 提示 符 下 ， 输 入 以 下 命令 : 

pip install Gi\Python 教材 编写 \ 安装 X ft WPYA 

rpy2-2.9.4-cp36-cp36m-win32.whl 

安装 成 功 后 会 有 如 下 提示 : 


Successfully built MarkupSafe 
Installing collected packages: MarkupSafe, jinja2, rpy2 
Successfully installed MarkupSafe-1.0 jinja2-2.10 rpy2-2.9.4 


FEIE, py 成 功 安装 到 计算 机 中 。 
7.4.2 安装 R 语言 工具 
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(OD FARiIZLA. 
下 载 链 接地 址 : https://www.r-project.org/ o 
单 击 尺 官网 主页 面 上 的 download R, 位置 如 图 7.4 所 示 。 


B FF wer projector 


q The R Project for Statistical Computing 
Getting Started 


Risa ee solivare enveorven tor tatsical and graphics. N comples and runs on a wide. 


Download vaetyl UNI platos, Windows and MacOS. T download RJpiease choose your prefered CRAN 


? ou have questions about R Ba how ta dowrioad and instal the sofware, o what the icense terms 
R Project are please read cur answers 1o requenty asked questons before you send an ema 


News 


= The R Foundation has been awarded me PersonaityOrgantzaton of he year 2018 award by he. 
profesional association of German market and sociai researchers. 


= R version 15.1 (Feather Spray) prerelease versions wa appear staring Friday 2018-0622 Final 
release is scheduled for Monday 2016-07-02 


* R version 150 (Joy in laying) has been released on 2018:04:23. 


News via Twitter 


Bow News trom he R Foundation 
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在 跳 转 的 镜像 界面 ， 下 拉 选 择 中 国 的 镜像 ， 我 们 选择 第 一 个 清华 大 学 
地 址 ， 位 置 如 图 7.5 所 示 。 


[一 Eee 
x Sofia Univeniy 
Canada. 
x Simon Fraser Univenity, Bumaby 
Mp: cr stat sfa ca Simon Fraser University. Bomaby 
bips. muug ca mirror cran Manitoba Unix User Group 
Meg; meos ca mirror cran Manitoba Unix User Group 
Meps; mirer s dal sacras Dalbousie University, Halifa 
bttp. mirror sts dal ca cran Dalhousie University, Halifax 
hnp cran utstat utoronto ca University of Toronto 
|Chile 
hnps. dnchlet mat puc cl Pontificia Universidad Catolica de Chile, Santiago 
hnp dinchletmat puc cl Pontificia Universidad Catolica de Chile, Santiago 
bops, cran dec uchile cl Departamento de Ciencias de la Computación, Universidad de Chile 
[china 
maA TUNA Team, Tunghua University 
benp. mirrors tuna tsinghua edu ca CRAN TUNA Team, Tsinghua University 
hips: mirrors uste edu cn CRAN: University of Science and Technology of China 
http mimorsustc edu cn CRAN) University of Science and Technology of China 
hnps:/mirrors eliteucn CRAN Elite Education. 
mpi mirror Izu edu cn CRAN Lanzhou University Open Source Society 
lez: mimer la ed co CRAN Lanzhou University Open Source Society 
x Tongji University 
" Shanghai Uniseniy 
[colomba 
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根据 自己 的 操作 系统 选择 相应 的 版 本 ， 这 里 选择 Download R for 
Windows 〈 本 机 的 操作 系统 是 Windows 10)， 位 置 如 图 7.6 所 示 。 
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The Comprehensive R Archive Network 


load and Install R 


binary distributions of the base system and contributed packages, Windows and Mae users most likely ant one of these 


henanes listed in the upper box, not the source code. The sources 
Ce 


* The latest release (2018-04-23, Joy in Playing) R-35 0 tat az, read whats new in the latest version. 
* Sources of R alpha and beta releases (daily snapshots, created only i tme periods before a planned release). 


* Daily snapshots of current patched and development verons are gale here Please read about pew features and bug fixes 
before filing corresponding feature requests or bug reports 


Manuals 


7.6 Download R for Windows 选项 
在 base 一 行 ， 单 击 install R for the first time 链接 ， 如 图 7.7 所 示 。 


€ O Q 8 Mm * E 


R for Windows 
Sobásectone 
Bnanes for base distribution. e e EEE E 


bue 
Binaries cf eseibel CRAN packages (er Rom 2 19x There is aiso formamos o thd pam 

cew sm ife n able Fot CRAN Wandom vr ces and coneendng eo tommen asd make anale 
Muon ski cen Bisanes of contributed CRAN packages for outdated versions of R (for R< 2 13x managed by Uwe Ligges) 
et Rache Toch to bud R an R package This is what you anto ld your own packages on Window, rte build R itl 
den Please do sot sobran to CRAN Package developers magie want to conac Une Ligge directly m cane of question. vogpeston related o Windows bares 
€ You may also want to read the REAQ and B for Windows FAQ 
Rosa Noe CRAN don ne checks on tese bares for vines, but cannot grve uates Use the normal precutons wt downloaded executables 
ufo. 
R Sources 
aan 
Packages 
Other 
Documensazon 
ami 


7.7 install R for the first time 选项 
单 击 Download R 3.5.0 for Windows 链接 ， 保 存 到 计算 机 ， 如 图 7.8 


所 示 。 
€ > O Q Mma * 
R-3.5.0 for Windows (32/64 bit) 
| Download R 3.5.0 for Windows (62 megabytes, 3264 bit) 
Installation and other instructions. 
CRAN Mew features in this version 
Mir 
Wars new? Hyon want te double check dr de package you bave somni matekes he pela donari by CRAN, you can compare be pdt 
F the master server You wil need a vermon of måSsum for windows both graphical and command lne versions are available 
Suh 
Frequently asked questions 
leur 
R Homepage .: venion of Windom? 
The R Joumal * How do Lapdate packages in my presion version of R? 
一 
Er Pene ere R EAQ fr general information about R adde R Videns FAQ for Window sperif information 
Bacares Other builds 
Other 
* Patches ro thus release are incorporated in the -patched wapıbot build 
| Documentation. * A build of thc development vernon (which will eventually become thc next mayor reicasc of R) 1 available in the r-dcvel snapshot build. 
Manuals * Previons releases 


7.8 Download R 3.5.0 for Windows 选项 


(2) 安装 。 
双击 下 载 的 可 执行 Jj 文件， 如 图 7.9 所 示 。 


^ aR 修改 日 期 mm 大 小 


i9 R-3.5.0-winexe 2018/7/2 11:23 应 用 程序 81,399 KB 
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7.9 下 载 的 可 执行 文件 
按照 安装 提示 步骤 一 步 步 以 默认 提示 往 下 操作 即 可 。 


7.4.3 测试 安装 
在 Python Shell 中 输入 以 下 命令 : 


>>> import rpy2.robjects as rob 

没有 任何 错误 提示 即 表 示 rpy2 模块 ，R 语言 工具 安装 成 功 ， 可 以 进行 
R 调用 。 
7.4.4 ”调用 民 示 例 


1. Python 调用 R 对 象 

使 用 rpy2.robjects EHI R 对 象 ， 调 用 方法 如 下 : 
>>> import rpy2.robjects as rob 

有 3 种 语法 格式 调用 R 对 象 : 

第 一 种 ， 实 验 代码 如 下 : 

>>> rob.r['pi'] 

实验 代码 运行 效果 如 下 : 


R object with classes: ('numeric',) mapped to: 
«FloatVector - Python:0x06ADE0OA8 / R:0x08BBE9D8> 
[3.141593] 


第 二 种 ， 实 验 代码 如 下 : 
>>> rob.r('pi') 
实验 代码 运行 效果 如 下 : 


R object with classes: ('numeric',) mapped to: 
«FloatVector - Python:0xX06ADCE68 / R:0x08BBE9D8> 
[3.141593] 


第 三 种 ， 实 验 代码 如 下 : 
>>> rob.r.pi 
实验 代码 运行 效果 如 下 : 


R object with classes: (‘numeric',) mapped to: 
«FloatVector - Python:0x06ADE030 / R:0x08BBE9D8- 
[8.141593] 


2. 载 入 和 使 用 及 包 


使 用 rpy2.robjects.packages.importr 对 象 ， 调 用 方法 如 下 : 


>>> from rpy2.robjects.packages import importr 
>>> base = importr('base") 
>>> stats = importr('stats") 


调用 示例 代码 如 下 : 
>>> stats.rnorm(10) 
R object with classes: (‘numeric',) mapped to: 


*FloatVector - Python:0x06ADB5A8 / R:0x0A1E6F80» 
[-0.921976, 0.049949, 0.306161, 1.092040, ..., -0.415047, 0.321349, -0.271509, 


0.852308] 
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7.5.1 使 用 datetime 模块 


要 使 用 datetime 模块 ， 使 用 import 导入 系统 中 : 


>>> import datetime 


datetime 模块 包含 如 表 7.2 所 示 的 常量 和 类 。 


表 7.2 datetime 模块 的 常量 和 类 


常量 /类 功能 说 明 

MAXYEAR 返回 能 表示 的 最 大 年 份 
MINYEAR 返回 能 表示 的 最 小 年 份 
date 日 期 对 象 ， 常 用 的 属性 有 year、month 和 day 
datetime 日 期 时 间 对 象 ， 常用 的 属性 有 hour. minute, second 和 microsecond 
datetime CAPI | 日 期 时 间 对 象 C 语言 接口 
time 时 间 对 象 
timedelta 时 间 间 隔 ， 即 两 个 时 间 点 之 间 的 长 度 
timezone 时 区 对 象 
tzinfo 时 区 信息 对 象 ， 抽 象 类 不 能 直接 用 

Datetime 模块 常用 示例 如 下 : 

(1) date 类 对 象 的 应 用 示例 。 

实验 数据 如 下 : 


>>> import datetime 
>>> now = datetime.date.today() 


>>> now.year 
2018 
>>> now.month 
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>>> now.day 

26 

(2) 让 所 使 用 的 日 期 符合 ISO 标准 。 
实验 数据 如 下 : 

>>> import datetime 

>>> now = datetime.date.today() 

»»» now.isocalendar() # 年 份 ， 周 数 ， 星 期 数 
(2018, 26, 2) 

(3) 计算 公元 公历 开始 到 现在 的 天 数 。 
实验 数据 如 下 : 

>>> import datetime 

>>> now = datetime.date.today() 


»»» now.toordinal() # 公 元 1 年 1 月 1 日 为 1 
736871 


2 使 用 sys 模块 


sys 模块 的 常用 函数 实验 。 
(1) sysargv: 从 程序 外 部 向 程序 传递 参数 。 


>>> import sys 
>>> sys.argv 


r 
(2) sys.exit ([arg]): 程序 中 间 的 退出 ，arg=0 为 正常 退出 。 


>>> import sys 
>>> Sys.exit(0) 


(3) sys.getdefaultencoding(): 获取 系统 当前 编码 。 


>>> import sys 
>>> Sys.getdefaultencoding() 
"utf-8' 


(4) sys.getfilesystemencoding(): 获取 文件 系统 使 用 编码 方式 。 
>>> import sys 

>>> sys.getfilesystemencoding() 

'utf-8' 

(5) sys.path: 获取 指定 模块 搜索 路 径 的 字符 串 集合 。 


>>> import sys 
>>> sys.path 


r, 
'CA\Users\\Lenovo\\AppData\\Local\\Programs\\Python\\Python36-32\\Lib\\idlelib 


'C:\\Users\\Lenovo\\AppData\\Local\\Programs\\Python\\Python36-32\\python36. 
zip', 'CWUsersWLenovoWAppDataWLocalWProgramsWPythonWPython36-32WDLLs', 
'CNUsersWLenovoWAppDataWLocalWProgramsWPythonWPython36-32Wib', 
'CNUsersWLenovoWAppDataWLocalWProgramsWPythonWPython36-32', 
'CNUsersW.enovoWAppDataWLocalWProgramsWPythonWP ython36-32WibWsite-p 
ackages'] 


(6) sys.platform: 获取 当前 系统 平台 。 


>>> import sys 

>>> Sys.platform 

'win32" 

C7) sysstdin, sys.stdout, sys.stderr: 包含 与 标准 VO 流 对 应 的 流 对 象 。 


>>> import sys 

>>> Sys.stdin 

*idlelib.run.PseudolnputFile object at 0x0319ABBO» 
>>> Sys.stdout 

«idlelib.run.PseudoOutputFile object at 0x0319ABD0> 
>>> Sys.stderr 

«idlelib.run.PseudoOutputFile object at 0x0319ABF0> 


7.5.8 ”使 用 与 数学 有 关 的 模块 


Python 内 置 了 数学 运算 类 〈 除 了 加 减 乘除 ) 的 函数 ， 直 接 调用 即 可 。 
(1) 例 : 将 整数 280 转换 为 十 六 进 制 字符 串 。 

实验 数据 如 下 : 

>>> hex(280) 

'0x118* 

在 程序 开发 中 经 常用 import 导入 math 模块 到 Python 中 进行 调用 。 
(2) fi: 将 整数 19 开平 方 。 

实验 数据 如 下 : 

>>> import math 

>>> print(math.sqrt(19)) # 开 平方 

4.358898943540674 

(D fl: 拆 分 198.679 的 小 数 和 整数 。 

实验 数据 如 下 : 


>>> print(math.modf(198.679)) # 拆 分 小 数 和 整数 
(0.679000000000002, 198.0) 


[s 
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(4) 例 : 计算 列表 [345,129,19.7,983] 中 数字 的 和 (结果 为 浮 点 数 )。 
实验 数据 如 下 : 


>>> print(math.fsum([345, 129, 19.7,983])) 
1476.7 


7.5.4” 自 定义 和 使 用 模块 


1. 自 定义 模块 

打开 IDLE 软件 ， 单 击 File 菜单 中 的 New File 选项 ， 新 建 一 个 名 为 
testmodule.py 的 文件 ， 保 存 到 IDLE 所 在 的 目录 下 。 

实验 的 本 机 目录 是 : 

Ci\Users\LenovoWAppData\Local\Programs\Python\Python36-32 

实验 代码 内 容 如 下 : 

def SumPrice(x,y):# 计 算 商 品 的 价格 

return x*y 

2. 使 用 自 定义 模块 

导入 文件 与 当前 文件 在 同一 目录 。 

实验 代码 内 容 如 下 : 

>>> import testmodule as A 


>>> A.SumPrice(7,9) 
63 


7.6 小 结 


模块 是 一 组 Python 代码 的 集合 ， 可 以 使 用 其 他 模块 ， 也 可 以 被 其 他 模 
块 使 用 。 

模块 让 你 能 够 有 逻辑 地 组 织 Python 代码 段 。 

模块 能 定义 函数 、 类 和 变量 ， 模 块 里 也 能 包含 可 执行 的 代码 。 

如 果 要 存储 datetime， 最 佳 方法 是 将 其 转换 为 timestamp 再 存储 ， 因 为 
timestamp 的 值 与 时 区 完全 无 关 。 

json 序列 化 方法 : 

dumps 为 无 文件 操作 :dump 为 序列 化 + 写 入 文件 。 

json 反 序列 化 方法 : 

loads 为 无 文件 操作 ; load 为 读 文件 + 反 序 列 化 。 
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习题 

一 、 问 答题 

1. 在 os.path 模块 中 ， 用 什么 方法 来 测试 指定 的 路 径 是 否 为 文件 ? 

2. 在 os 模块 中 ， 用 什么 方法 来 返回 包含 指定 文件 夹 中 所 有 文件 和 子 文 
件 夹 的 列表 ? 

二 、 程 序 设计 题 

对 输入 的 日 期 字符 串 〈 格 式 为 : 20180702) 转换 输出 指定 格式 的 日 期 
(格式 为 : 07/02/2018 星期 一 )， 程 序 中 要 用 到 datetime 模块 。 
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类 和 对 人 象 


在 Python 中 ， 无 处 不 对 象 ， 处 处 都 是 对 象 。 然 而 在 很 多 时 候 ， 我 们 不 
知道 对 象 是 什么 ， 只 是 在 学 习 时 知道 面向 对 象 编 程 这 个 概念 ， 但 是 我 们 使 
用 起 来 却 非常 好 用 ， 这 就 类 似 我 们 学 开车 ， 要 学 会 开车 不 用 理解 汽车 的 原 
理 ， 但 如 果 是 赛车 手 ， 汽 车 的 原理 就 是 非常 重要 的 ， 我 们 必须 要 懂 汽 车 的 
原理 ， 这 有 助 于 把 车 开 得 更 好 。 本 章 将 给 大 家 介绍 对 象 和 类 。 


8.1 理解 面向 对 象 
8.1.1 面向 对 象 编程 的 概念 


面向 对 象 编程 (Object Oriented Programming，OOP)， 是 一 种 程序 设计 
思想 ， 是 以 建立 模型 体现 出 来 的 抽象 思维 过 程 和 面向 对 象 的 方法 。 模 型 是 
用 来 反映 现实 世界 中 事物 特征 的 ， 是 对 事物 特征 和 变化 规律 的 抽象 化 ， 是 
更 普遍 、 更 集中 、 更 深刻 地 描述 客体 的 特征 。OOP 把 对 象 作为 程序 的 基本 
单元 ， 一 个 对 象 包含 了 数据 和 操作 数据 的 函数 。 


8.1.2 面向 对 象 术语 简介 
面向 对 象 常用 的 术语 如 下 。 
O 类 : 是 创建 对 象 的 代码 段 ， 描 述 了 对 象 的 特征 、 属 性 、 要 实现 
的 功能 ， 以 及 采用 的 方法 等 。 
O 属性 : 描述 了 对 象 的 静态 特征 。 


m] 
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方法 : 描述 了 对 象 的 动态 动作 。 

对 象 : 对 象 是 类 的 一 个 实例 ， 就 是 模拟 真实 事件 ， 把 数据 和 代 
码 都 集合 到 一 起 ， 即 属性 、 方 法 的 集合 。 

实例 : 就 是 类 的 实体 。 

实例 化 : 创建 类 的 一 个 实例 的 过 程 。 

封装 : 把 对 象 的 属性 、 方 法 、 事 件 集中 到 一 个 统一 的 类 中 ， 并 
对 调用 者 屏蔽 其 中 的 细节 。 


继承 : 一 个 类 共享 另 一 个 类 的 数据 结构 和 方法 的 机 制 称 为 继承 。 


起 始 类 称 为 基 类 、 超 类 、 父 类 ， 而 继承 类 称 为 派生 类 、 子 类 。 
继承 类 是 对 被 继承 类 的 扩展 。 

多 态 : 一 个 同样 的 函数 对 于 不 同 的 对 象 可 以 具有 不 同 的 实现 ， 
就 称 为 多 态 。 

接口 : 定义 了 方法 、 属 性 的 结构 ， 为 其 成 员 提供 规约 ， 不 提供 
实现 。 不 能 直接 从 接口 创建 对 象 ， 必须 首先 创建 一 个 类 来 实现 
接口 所 定义 的 内 容 。 

ER: 一 个 方法 可 以 具有 许多 不 同 的 接口 , 但 方法 的 名 称 是 相 
同 的 。 

事件 事件 是 由 某 个 外 部 行为 所 引发 的 对 象 方法 。 

重 写 : 在 派生 类 中 , 对 基 类 某 个 方法 的 程序 代码 进行 重新 编码 ， 
使 其 实现 不 同 的 功能 ， 我 们 把 这 个 过 程 称 为 重 写 。 

构造 函数 :是 创建 对 象 所 调用 的 特殊 方法 。 

析 构 函数 : 是 释放 对 象 时 所 调用 的 特殊 方法 。 


,8.2 ”类 的 定义 与 使 用 


8.2.1 


类 的 定义 


类 就 是 对 象 的 属性 和 方法 的 封装 ， 静 态 的 特征 称 为 属性 ， 动 态 的 动作 
称 为 方法 。 
类 通常 的 语法 格式 如 下 : 


class ClassName: 


# 属 性 
[属性 定义 体 ] 
# 方 法 
[方法 定义 体 ] 


类 的 定义 以 关键 字 class 开始 ， 类 名 必须 以 大 写字 母 开头 ， 类 名 后 面 紧 
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REE «v. 
类 的 定义 示例 如 下 : 


class Person: # Python 的 类 名 约定 以 大 写字 母 开头 
#--- 类 的 一 个 示例 ---- 
# 属性 
Skincolor = "yellow" 
high = 168 
weight = 65 
# 方 法 
def goroad(self): 
print(" 人 走路 动作 的 测试 …”) 
def sleep(self): 
print(" 睡 觉 ， 晚 安 ! ") 


从 上 例 可 以 看 出 ， 属 性 就 是 变量 ， 静 态 的 特征 ， 方 法 就 是 一 个 个 的 函 
数 ， 通 过 这 些 函 数 来 描述 动作 行为 。 

在 定义 类 属性 时 一 般 用 名 词 ， 定 义 类 方法 时 一 般 用 动词 ， 类 名 约定 以 
大 写字 母 开 头 ， 函 数 约定 以 小 写字 母 开头 。 


8.2.2 ”类 的 使 用 
类 定义 好 之 后 ， 就 可 将 类 实例 化 为 对 象 。 类 实例 化 对 象 的 语法 格式 
如 下 : 
对 象 名 = 类 名 () 
实例 化 对 象 的 操作 符 是 等 号 “=”， 在 类 实例 化 对 象 时 ， 类 名 后 面 要 添 
加 一 个 括号 “0 ”。 
类 实例 化 示例 : 


>>> p = Person() 
上 例 将 类 Person 实例 化 为 对 象 p。 
8.2.3 ”类 的 构造 方法 及 专 有 方法 


类 的 构造 方法 是 _init (self). 

只 要 实例 化 一 个 对 象 ， 这 个 方法 就 会 在 对 象 被 创建 时 自动 调用 。 实 例 
化 对 象 时 是 可 以 传 入 参数 的 ， 这 些 参数 会 自动 传 入 _init (self. paraml, 
param2，.….) 方 法 中 ， 我 们 可 以 通过 重 写 这 个 方法 来 自 定义 对 象 的 初始 化 操 
作 ， 代 码 如 下 所 示 : 


>>> class Bear: 
def init (self,name): 
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selfname = name 
def kill(self): 
print("%s, 是 保护 动物 ， 不 能 杀 .…"% self.name) 
运行 结果 如 下 : 
>>> a = Bear(' 狗 熊 ') 
>>> a.kill() 
狗熊 ， 是 保护 动物 ， 不 能 杀 .… 
在 上 例 中 ， 重 写 了 _init (sel 人 方法 ， 如 果 没 有 重 写 ， 它 的 默认 调用 就 
Jé init _ (sel 人， 没有 任何 参数 或 只 有 一 个 self 参数 ， 所 以 在 实例 化 时 ， 参 
数 是 空 的 。 在 例子 中 ， 我 们 给 了 它 一 个 参数 name， 就 成 了 _ init (self, 
name)， 在 实例 化 时 就 可 以 传 参数 了 ， 因 为 第 一 个 参数 self 是 默认 的 ， 就 把 
“狗熊 ” 传 给 name， 运 行程 序 后 得 到 了 我 们 期 望 的 结果 ， 这 样 使 用 起 来 就 
非常 方便 。 
另外 ， 还 可 以 把 传 入 的 参数 设置 为 默认 参数 ， 在 实例 化 时 不 传 入 参数 
系统 也 不 会 报错 ， 代 码 如 下 所 示 : 


>>> class Bear: 
def init _(self,name = "默认 的 熊 "): 
self.name = name 
def kill(self): 
print("%s， 是 保护 动物 ， 不 能 杀 .…"% self.name) 
代码 运行 结果 如 下 : 


>>> b = Bear() 

>>> b.kill() 

默认 的 熊 ， 是 保护 动物 ， 不 能 杀 .… 

>>> c = Bear(' 替 代 能 ') 

>>> c.kill() 

蔡 代 能 ， 是 保护 动物 ， 不 能 杀 .… 

在 上 例 中 ， 我 们 把 构造 函数 的 参数 name. 设置 为 默认 值 “ 默 认 的 熊 ”， 
在 对 象 实例 化 时 没有 传 值 给 参数 name， 程 序 运行 正确 ， 输 出 了 期 望 的 结果 
“默认 的 能 ， 是 保护 动物 ， 不 能 杀 ...”， 当 在 对 象 实例 化 时 给 参数 name 传 值 
为 “替代 能 ”， 当 对 象 调用 方法 kill0 时 ， 输 出 了 正确 的 结果 “ 蔡 代 能 ， 是 
保护 动物 ， 不 能 杀 ...”。 


8.2.4 类 的 访问 权限 


大 家 都 知道 ， 在 C+HJava 中 ， 是 通过 关键 字 public. private 来 表明 访 
问 的 权限 是 公有 还 是 私有 的 。 然 而 在 Python 中 ， 默 认 情 况 下 对 象 的 属性 和 
方法 都 是 公开 的 、 公 有 的 ， 通 过 点 CO 操作 符 来 访问 ， 代 码 如 下 所 示 : 


141 —e 


*— 142 Python 语言 —* 


3E 


>>> class Company: 
name = " 云 创 科技 " 


运行 结果 如 下 : 


>>> c = Company() 

>>> c.name 

ZUR 

在 上 例 中 ， 直 接 通过 点 O 来 访问 类 Company 的 变量 name， 运 行 得 
到 结果 : 云 创 科技 。 

为 了 实现 类 似 于 私有 变量 的 特征 ，Python 内 部 采用 了 name mangling 
的 技术 〈 名 字 重 整 或 名 字 改 变 )， 在 变量 名 或 函数 名 前 加 上 两 个 下 画 线 
“_” 这 个 函数 或 变量 就 变 为 取 有 了 ， 代 码 如 下 所 示 ; 


>>> class Company: 
. name = " 云 创 科技 " 


运行 结果 如 下 : 


>>> c = Company() 
>>> c._ name 
Traceback (most recent call last): 
File "<pyshell#74>", line 1, in <module> 
c. name 
AttributeError: 'Company' object has no attribute' name" 
>>> c.name 
Traceback (most recent call last): 
File "<pyshell#75>", line 1, in «module» 
c.name 
AttributeError: 'Company' object has no attribute 'name' 


在 上 例 中 ， 在 类 Company 的 属性 name 前 面 加 了 两 个 下 夯 线 “ ”使 
其 变 为 了 私有 变量 ， 在 程序 外 面 以 命令 c. name 和 c.name 访问 都 会 出 错 。 

为 了 访问 类 中 的 私有 变量 ， 有 一 个 折衷 的 处 理 办 法 ， 代 码 如 下 例 所 示 : 
>>> class Company: 

. name = " 云 创 科技 " 

def getname(self): 

return self... name 

运行 结果 如 下 : 
>>> c = Company() 


>>> c.getname() 
' 云 创 科技 ' 


在 上 例 中 ， 在 类 Company 内 部 重新 定义 一 个 方法 getname(self), FE 
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序 外 部 通过 访问 对 象 的 getname() 方 法 来 访问 类 Company 中 的 私有 变量 : 
. name. 
实际 上 ，Python 把 双 下 夯 线 “ ”开头 的 变量 名 改 为 了 单 下 夯 线 “_” 
类 名 + 双 下 面 线 “ ”变量 名 ， 即 “ 类 名 变量 名 ”， 因 此 可 以 通过 以 下 的 
访问 方式 来 访问 类 的 私有 变量 ， 代 码 如 下 例 所 示 : 
>>> class Company: 
. name = " 云 创 科技 " 
def getname(self): 
return self. name 
运行 结果 如 下 : 
>>> c = Company() 
>>> c.getname() 
' 云 创 科 技 ' 
>>> c. Company name 
' 云 创 科技 ' 
在 上 例 中 , 访问 了 对 象 c 的 Company name, 运行 得 到 了 期 望 的 结果 。 
由 此 可 见 ， 就 目前 而 言 ，Python 的 私有 机 制 是 伪 私 有 ， 了 Python 的 类 是 
没有 权限 控制 的 ， 变 量 是 可 以 被 外 部 调用 的 。 


8.2.5 ”获取 对 象 信息 


类 实例 化 对 象 之 后 ， 对 象 就 可 以 调用 类 的 属性 和 方法 ， 语 法 格式 如 下 : 


对 象 名 . 属性 名 
对 象 名 . 方法 名 


对 象 调用 类 的 属性 或 方法 的 操作 符 是 点 “.”。 
对 象 调用 属性 或 方法 的 示例 : 
>>> p.goroad() 

人 走路 动作 的 测试 … 

>>> p.skincolor 

'yellow' 

>>> p.sleep() 

有 睡觉， 晚安 ! 

>>> p.high 

168 

>>> p.weight 

65 


在 上 例 中 , 对象 p 分 别 调用 了 类 Person 的 方法 goroad、 属 性 skincolor、 
方法 sleep、 属 性 high、 属 性 weight. 
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83 ”类 的 特点 
8.3.1 封装 


从 形式 上 看 ， 对 象 封装 了 属性 就 是 变量 ， 而 方法 和 函数 是 独立 性 很 强 
的 模块 ， 封 装 就 是 一 种 信息 掩蔽 技术 ， 使 数据 更 加 安全 。 

例如 ,列表 (list) 是 Python 的 一 个 序列 对 象 , 我 们 要 对 列表 进行 调整 
代码 如 下 所 示 : 

>>> list! = [K'/J'/L''Q'M] 

>>> list1.sort() 

>>> list1 

J 'L' Y a] 

在 上 例 中 ， 我 们 调用 了 排序 函数 sort0 对 无 序 的 列表 进行 了 正 序 排序 。 
由 此 可 见 ，Python 的 列表 就 是 对 象 ， 它 提供 了 若干 种 方法 供 我 们 根据 需求 
调整 整个 列表 ， 但 是 我 们 不 知道 列表 对 象 里 面 的 方法 是 如 何 实现 的 ， 也 不 
知道 列表 对 象 里 面 有 哪些 变量 ， 这 就 是 封装 。 它 封装 起 来 ， 只 给 我 们 需要 
的 方法 的 名 字 ， 然 后 调用 这 个 名 字 ， 知 道 它 可 以 实现 即 可 ， 然 而 它 没有 具 
体 告 诉 我 们 是 怎么 实现 的 。 


8.3.2 多 态 


不 同 对 象 对 同一 方法 响应 不 同 的 行动 就 是 多 态 。 
代码 如 下 所 示 : 


>>> class Test X: 
def func(self): 
print(" 测 试 X.…") 
>>> class Test Y: 
def func(self): 
print(3liX Y...) 
运行 结果 如 下 : 
>>> x = Test_X() 
>>> y= Test_Y() 
>>> x.func() 
测试 X... 


>>> y.func() 
A Y... 


上 例 分 别 定 义 了 两 个 类 : Test X 和 Test Y, 每 个 类 里 面 都 定义 了 同名 
函数 func, PRX func 分 别 实现 的 功能 是 输出 字符 串 “ 测 试 X...” 和 “测试 
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Y..", 类 Test X0 的 实例 对 象 为 x， 类 Test Y0 的 实例 对 象 为 Y， 对 象 x 和 
对 象 y 分 别 调用 了 同名 函数 fhnc0， 分 别 运行 得 到 了 不 同 的 结果 : 测试 义 .… 
和 测试 Y.……。 由 此 可 见 ,不 同 对 象 调用 了 同名 方法 (函数 ), 实 现 的 结果 不 一 样 ， 
需要 注意 的 是 ，self 相当 于 C++ 的 this 指针 。 由 同一 个 类 可 以 生成 无 数 
个 对 象 ， 这 些 对 象 都 来 源 于 同一 个 类 的 属性 和 方法 ， 当 一 个 对 象 的 方法 被 
调用 时 ， 对 象 会 将 自身 作为 第 一 个 参数 传 给 self 参数 ， 接 收 self 参数 时 ， 
Python 就 知道 是 哪 一 个 对 象 在 调用 方法 了 。 代 码 如 下 所 示 : 
>>> class Bear: 
def setname(self,name): 
self.name - name 
def kill(self): 
print("%s， 是 保护 动物 ， 不 能 杀 .…"% self.name) 
运行 结果 如 下 : 


>>> ab = Bear() 

>>> ab.setname(' 大 熊 ) 

>>> cd = Bear() 

>>> cd.setname(' 黑 能 ) 

>>> ab.kill() 

大 熊 ， 是 保护 动物 ， 不 能 杀 .… 
>>> cd.kill() 

黑熊 ， 是 保护 动物 ， 不 能 杀 .… 


在 上 例 中 ， 对 象 ab 和 对 象 cd 调用 了 同一 个 方法 kill0， 然 而 得 到 的 结 
果 分 别 是 “大 熊 , 是 保护 动物 , 不 能 杀 ...” 和 “黑熊 , 是 保护 动物 , 不 能 杀 ...”， 
因为 在 调用 时 , ab.kill0 第 一 个 参数 是 隐藏 的 , 就 是 把 ab 对 象 的 标志 传 进去 ， 
self 收 到 后 ，selfname 就 会 找到 对 象 ab 的 name 属性 ， 然 后 把 它 赋值 打印 
出 来 ， 然 而 这 都 是 Python 在 后 台 自 动 完成 的 ， 只 要 在 定义 类 时 ， 把 self 写 
进 第 一 个 参数 ， 这 是 默认 的 要 求 。 


8.8.8 ”继承 


继承 是 子 类 自动 共享 父 类 的 数据 和 方法 的 机 制 。 
语法 格式 如 下 : 


Class ClassName(BaseClassName): 


口 ClassName: 是 子 类 的 名 称 ， 第 一 个 字母 必须 大 写 。 
口 BaseClassName: 是 父 类 的 名 称 。 
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被 继承 的 类 称 为 基 类 、 父 类 或 超 类 ， 而 继承 者 称 为 子 类 ， 子 类 可 以 继 


承 父 类 的 任何 属性 和 方法 。 
以 列表 对 象 为 例 ， 程 序 代码 如 下 所 示 : 


>>> class Test list(list): 
pass 


运行 结果 如 下 : 


>>> list1 = Test list() 
>>> list1.append('O') 
>>> list1 

ro] 

>>> list1.append('MT') 
>>> list1 

[O','MT] 

>>> list1.sort() 

>>> list 

[MT '0] 


上 例 定义 了 一 个 类 Test_list0， 它 继承 list， 然 后 将 它 赋值 给 变量 listl， 
listl 分 别 调 用 了 append0、sort() 方 法 ， 得 到 了 我 们 所 期 望 的 结果 。 从 中 可 
以 看 出 ， 我 们 定义 了 类 Test_list0， 它 继承 了 属于 list 的 属性 和 方法 ， 所 以 ， 


我 们 就 可 以 在 对 象 Test_list 里 面 使 用 了 ， 这 就 是 继承 。 
在 使 用 类 继承 机 制 时 ， 有 以 下 几 点 需要 注意 : 


OD 如 果子 类 中 定义 与 父 类 同名 的 方法 或 属性 ， 则 会 自动 覆盖 父 类 对 


应 的 方法 或 属性 。 程 序 代码 如 下 所 示 : 


>>> class ParentClass: 
def printStr(self): 
print(" 这 里 调用 的 是 父 类 的 方法 ! ") 
>>> class ChildClass(ParentClass): 
def printStr(self): 
print(" 这 里 调用 的 是 子 类 的 方法 ! ") 


运行 结果 如 下 : 


>>> p = ParentClass() 
>>> p.printStr() 

这 里 调用 的 是 父 类 的 方法 ! 
>>> c= ChildClass() 

>>> c.printStr() 

这 里 调用 的 是 子 类 的 方法 ! 


>>> 


在 上 例 中 ，p.printStr0 调 用 的 是 父 类 的 方法 ， 输 出 结果 “这 是 


有 8 调用 的 是 


父 类 的 方法 !”，c.printStr0 调 用 了 和 父 类 同名 的 方法 ， 输 出 结果 “这 里 调用 


的 是 子 类 的 方法 !”， 这 里 覆盖 的 是 子 类 的 实例 对 象 里 面 的 方法 而 已 ， 对 父 


类 不 产生 影响 。 


(2) 子 类 重 写 了 父 类 的 方法 就 会 把 父 类 的 同名 方法 覆盖 ， 如 果 被 重 


的 子 类 同名 的 方法 里 面 没有 引入 父 类 同名 的 方法 ， 实 例 化 对 象 要 调 有 
的 同名 方法 时 ， 程 序 就 会 报错 ， 程 序 代 码 如 下 : 


import random as s 
class Dog: 
def init (self): 
self.x = s.randint(10,50) 
self.y = s.randint(10,50) 
def run. Dog(self): 
self.x += 1 
print(" 基 狗 的 位 置 是 : ",self.x,self.y) 
class GoldDog(Dog): 
pass 
class BlackDog(Dog): 
pass 
class YellowDog(Dog): 
pass 
class MyDog(Dog): 
def init (self): 
self.hungry = True 
def chi(self): 
if self.hungry: 
print(" 狗 的 梦想 就 是 天 天 有 吃 的 。") 
self.hungry = False 
else: 
print eR TB f» ") 


运行 结果 如 下 : 


>>> dog = Dog() 

>>> dog.run Dog() 

基 狗 的 位 置 是 : 3024 

>>> dog.run Dog() 

基 狗 的 位 置 是 : 3124 

>>> golddog = GoldDog() 
>>> golddog.run Dog() 

基 狗 的 位 置 是 : 4246 

>>> blackdog = BlackDog() 
>>> blackdog.run Dog() 

基 狗 的 位 置 是 : 3911 

>>> yellowdog = YellowDog() 
>>> yellowdog.run Dog() 
基 狗 的 位 置 是 : 4021 

>>> mydog = MyDog() 


写 
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>>> mydog.chi() 
狗 的 梦想 就 是 天 天 有 吃 的 。 
>>> mydog.chi() 
狗 已 经 吃 饱 了。 
>>> mydog.run. Dog() 
Traceback (most recent call last): 
File "<pyshell#38>", line 1, in «module» 
mydog.run Dog() 
File "G:/jicheng 2018062101.py", line 9, in run Dog 
self.x += 1 
AttributeError: 'MyDog' object has no attribute 'x' 
在 上 例 中 ， 子 类 MyDog 重 写 了 基 类 Dog 的 构造 函数 ”init (self), 8 
么 子 类 就 覆盖 了 基 类 的 同名 构造 函数 ， 然 而 在 子 类 中 没有 对 构造 函数 中 的 
变量 selfx 和 selfy 重新 赋值 , 导致 子 类 实例 对 象 调用 方法 run_ DogO 时 报错 ， 
提示 对 象 MyDog 找 不 到 属性 x 的 值 。 
要 解决 上 述 问题 ， 就 要 在 子 类 里 面 重 写 父 类 同名 方法 时 ， 先 引入 父 类 
的 同名 方法 。 要 实现 这 个 继承 的 目的 ， 有 两 种 技术 可 采用 : 一 是 调用 未 绑 
定 的 父 类 方法 ， 二 是 使 用 super 函数 。 
我 们 先 来 了 解 “ 调 用 未 绑 定 的 父 类 方法 ”的 技术 ， 它 的 语法 格式 如 下 : 


paraname.func(self) 


口 Paraname: 父 类 的 名 称 。 
口 .: ABER. 
口 func: 子 类 要 重 写 的 父 类 的 同名 方法 名 称 。 
O self: 子 类 的 实例 对 象 ， 注 意 这 里 不 是 父 类 的 实例 对 象 。 
示例 程序 代码 和 上 例 相 同 ， 仅 对 子 类 的 MyDog (Dog) 的 _init (self)77 
法 做 修改 ， 修 改 后 的 _init (selb 代 码 如 下 : 
def init (self): 
Dog. init (self) # 调 用 未 绑 定 的 父 类 方法 
self.hungry = True 
代码 运行 结果 如 下 : 


>>> mydog = MyDog() 
>>> mydog.chi() 

狗 的 梦想 就 是 天 天 有 了 吃 的 。 
>>> mydog.chi() 

gp emt. 

>>> mydog.run Dog() 

基 狗 的 位 置 是 : 2019 


在 上 例 中 , 在 子 类 MyDog 中 重 写 父 类 Dog 的 同名 方法 init 时 ， 以 指令 
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Dog. init _ (self) 引入 了 父 类 Dog 的 同名 方法 init， 然 而 参数 self 传 入 的 
是 子 类 MyDog 的 实例 化 对 象 mydog， 所 以 这 种 技术 称 为 “调用 未 绑 定 的 父 
类 方法 ”。 
接 下 来 ， 看 看 “使 用 super 函数 ”的 技术 ，super 函数 可 以 自动 找到 基 
类 的 方法 和 传 入 self 参数 ， 它 的 语法 格式 如 下 : 
super().func([parameter]) 
O super(): super 函数 。 
OQ .: ABER. 
O fune: 子 类 要 重 写 的 父 类 的 同名 方法 名 称 。 
O parameter: ASA, WREE self 可 以 省 略 。 
示例 程序 代码 和 上 例 相 同 ， 仅 对 子 类 的 MyDog(Dog) 的 _init (self)77 
法 做 修改 ， 修 改 后 的 _init_(sel 人 代码 如 下 : 
def init (self): 
super() init ()*$ super 函数 
self.hungry 7 True 
代码 运行 结果 如 下 : 


>>> mydog1 = MyDog() 
>>> mydog1.run_Dog() 
基 狗 的 位 置 是 : 2721 


>>> mydog1.run_Dog() 

基 狗 的 位 置 是 : 28 21 

在 上 例 中 ， 使 用 super 函数 调用 了 要 重 写 的 基 类 Dog 的 同名 方法 : 
. init ， 连 参数 self 也 可 以 省 略 。 

使 用 super 函数 的 方便 之 处 在 于 不 用 写 任何 基 类 的 名 称 , 直接 写 重 写 的 
方法 即 可 ， 这 样 Python 会 自动 到 基 类 去 寻找 ， 尤 其 是 在 多 重 继承 中 ， 或 者 
子 类 有 多 个 祖先 类 时 ，super 函数 会 自动 到 多 种 层级 关系 里 面 去 寻找 同名 的 
方法 。 使 用 super 函数 带 来 一 个 好 处 ， 如 果 以 后 要 更 改 基 类 ， 直 接 修改 括号 
“0” 里 面 的 基 类 名 称 即 可 ， 不 用 再 修改 重 写 的 同名 方法 里 面 的 内 容 。 


8.3.4 多 重 继承 
可 以 同时 继承 多 个 父 类 的 属性 和 方法 ， 称 为 多 重 继承 。 语 法 格式 如 下 : 


Class ClassName(Base1, Base2, Base3): 


ClassName: 子 类 的 名 字 。 
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ū Basel. Base2, Base3: 基 类 1 的 名 字 、 基 类 2 的 名 字 、 基 类 3 
的 名 字 。 有 多 少 个 基 类 ， 名 字 依次 写 入 即 可 。 
举 个 例子 ， 代 码 如 下 : 
>>> class BaseClass1: 
def func1 (self): 
print("func1 是 我 ， 我 是 BaseClass1 的 代理 。") 
>>> class BaseClass2: 
deffunc2(self): 
print("func2 是 我 ， 我 是 BaseClass2 的 代理 。") 
>>> class Ds(BaseClass1,BaseClass2): 
pass 
运行 结果 如 下 : 
>>> c= Ds() 
>>> c.func1() 
func1 是 我 ， 我 是 BaseClass1 的 代理 。 
>>> c.func2() 
func2 是 我 ， 我 是 BaseClass2 的 代理 。 
在 上 例 中 ， 子 类 Ds 分 别 继 承 了 基 类 BaseClassl 和 基 类 BaseClass2, 于 
类 Ds 可 以 调用 基 类 BaseClassl 的 方法 funcl， 也 可 以 调用 基 类 BaseClass2 
的 方法 func2。 
虽然 多 重 继承 的 机 制 可 以 让 子 类 继承 多 个 基 类 的 属性 和 方法 使 用 起 来 
很 方便 ， 但 很 容易 导致 代码 混乱 ， 有 时 候 会 引起 不 可 预见 的 Bug， 对 程序 
而 言 不 可 预见 的 Bug 几乎 就 是 致命 的 。 因 此 ， 当 不 确定 必须 要 使 用 “多 重 
继承 ”语法 时 ， 尽 量 避 免 使 用 它 。 


84 实验 
8.4.1 声明 类 


声明 类 以 关键 字 class 开始 ， 类 名 以 大 写字 母 开头 ， 类 名 后 面 紧 跟 冒号 “:”。 
(1) 通过 函数 将 参数 传 入 对 象 中 。 


实验 代码 内 容 如 下 : 
>>> class TestClass: 
def CreateName(self, number): 
self.name - number 
def trye(self): 
print(" 这 是 %s, 谁 叫 我 "%selfname) 


实验 运行 结果 如 下 : 


>>> ac-TestClass() 

>>> ac.CreateName(' 猫 ) 
>>> print(ac.trye()) 
REH, WUR 


None 


(2) 通过 构造 函数 将 参数 直接 通过 调用 类 导入 对 象 中 。 
实验 代码 内 容 如 下 : 


>>> class Class_b: 
def init (self,num): 
self.name-num 
def test(self): 
print("my name is96s"96self.name) 


实验 运行 结果 如 下 : 


>>> bc-Class b("xion hong") 
>>> print(bc.test()) 

my name is xion hong 

None 


8.4.2 ”类 的 继承 和 多 态 


中 


在 类 的 继承 中 ， 子 类 获得 了 父 类 的 全 部 属性 及 功能 。 在 类 的 多 态 特 性 
对 扩展 开放 ， 对 修改 封闭 。 
在 实验 中 演示 组 合 继承 ， 同 时 融合 多 重 继承 和 多 态 特 性 。 


实验 代码 内 容 如 下 : 
class Turtle: 
def init (self,x): 
self.num = x 
class Fish: 
def init (self,x): 
self.num = x 
class Turtle Child(Turtle):24&7& 7 Turtle 
def init (self,x): 
super()，_init_(x)# 重 写 父 类 构造 函数 
selfhungry = True 
def eat(self): 
if self.hungry: 
print(" 小 乌龟 要 吃食 ! ") 
self.hungry = False 
else: 
print" Star, MET! ") 
class Pond: 
def _init _(self,x,y,z):# 组 合 继承 实 列 
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self.turtle = Turtle(x)# 继 承 了 Turtle 
self.fish = Fish(y)# 继 承 了 file 
self.turtle_child =Turtle_Child(z) 44;& 7 Turtle Child 
def print num(self): 
print(" 水 池 里 总 共有 乌龟 %d 只 ,小 鱼 96d 条 ， 小 乌龟 %d R. "% 
(self.turtle.num,self.fish.num,self.turtle child.num)) 
self.turtle child.eat() 


实验 运行 结果 如 下 : 


>>> w-Pond(189,34,6) 

>>> w.print num() 

水 池 里 总 共有 乌龟 189 只 ， 小 鱼 34 条 ， 小 乌龟 6 只 。 

小 乌龟 要 吃食 ! 

>>> W.print num() 

水 池 里 总 共有 乌龟 189 只 ， 小 鱼 34 条 ， 小 乌龟 6 只 。 

小 鸟 包 吃 饱 了 ,不 乃 了 ! 

在 实验 中 ， 类 Turtle Child 继承 了 类 Turtle， 并 且 重 写 了 _init 函数 ， 
用 到 了 函数 的 多 态 特性 ， 在 重 写 中 使 用 了 super() 方 法 。 类 Pond 组 合 继承 了 
类 Turtle, Fish 和 Turtle Child. 


8.4.8 复制 对 象 


Python 中 复制 对 象 有 以 下 几 种 方式 : 

(1) 采用 赋值 操作 符 “=” 复 制 对 象 。 采 用 这 种 方式 传 对 象 的 引用 ， 原 
始 对 象 元 素 修改 ， 引 用 后 对 象 的 元 素 也 会 跟着 修改 。 

对 象 元 素 修改 前 的 实验 代码 内 容 如 下 : 

>>> arr_test=[45,' Python',[49,62],{fname':jack,sex:male},str]# 原 始 对 象 

>>> AB=arr_test 

>>> print(' 原 始 数据 是 : ,arr_test) 

原始 数据 是 : [45,'Python', [49, 62], {name': 'jack', 'sex': 'male'}, 'str'] 

>>> print(' 引 用 后 的 数据 是 : ',AB) 

引用 后 的 数据 是 : [45, 'Python', [49, 62], fname' 'jack', 'sex': 'male'}, 'str] 

对 象 元 素 修改 后 的 实验 代码 内 容 如 下 : 


>>> arr test[2].append('481') 

>>> print(' 引 用 后 的 数据 是 : ',AB) 

引用 后 的 数据 是 : [45, 'Python', [49, 62, '4817, {name': 'jack', 'sex': 'male"), 'str'] 

(2) 采用 copy 模块 的 命令 copy.copy0 或 copydeepcopy0。 这 两 种 指令 
在 使 用 上 有 以 下 区 别 : 

指令 copycopy0 除 了 复制 对 象 的 原始 元 素数 据 外 ， 当 对 象 进行 
copy.copy0 操 作 后 ， 对 象 嵌 套 元 素 的 append 操作 后 的 数据 也 将 被 复制 。 
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J, 


指令 copy.deepcopy0 仅 仅 复制 对 象 的 原始 元 素数 据 。 
实验 代码 内 容 如 下 : 


>>> arr_test=[45,'Python',[49,62],{name":jack'",'sex'…male'),'str]# 原 始 对 象 数据 
>>> import copy 

>>> A=copy.copy(arr_test) 

>>> B=copy.deepcopy(arr_test) 

>>> arr_testappend('addstr)# 修 改 对 象 arr_test 

>>> arr_test[2].append('addstr1")# 修 改 对 象 arr_test 中 的 [49，62] 数 组 对 象 


实验 代码 输出 结果 如 下 : 


>>> print(' 修 改 后 的 原始 数据 为 : "arr test) 

修改 后 的 原始 数据 为 : [45, 'Python', [49, 62, 'addstr1'], name": 'jack', 'sex': 
"male", 'str', 'addstr'] 

>>> print(' 利 用 copy.copy 命令 后 的 数据 为 : "A) 

利用 copy.copy 命令 后 的 数据 为 : [45,'Python', [49, 62, 'addstr1'], fname': 'jack', 
'sex': 'male?, 'str'] 

>>> print(' 利 用 copy.deepcopy 命令 后 的 数据 为 : ',B) 

利用 copy.deepcopy 命令 后 的 数据 为 : [45,'Python', [49, 62], fname' 'jack', 'sex': 
"male", 'str'] 

>>> arr test[3]-'93.7" 

>>> print( 利 用 copy.copy 命令 后 的 数据 为 : "A) 

利用 copy.copy 命令 后 的 数据 为 : [45, 'Python', [49, 62, 'addstr1'], 'name": 'jack', 
'sex': 'male'}, 'str] 

>>> print(' 利 用 copy.deepcopy 命令 后 的 数据 为 : "B) 

利用 copy.deepcopy 命令 后 的 数据 为 : [45, 'Python', [49, 62], ('name": 'jack', 'sex': 
"male", 'str'] 

>>> print(' 再 次 修改 后 的 原始 数据 为 : ,arr_test) 

再 次 修改 后 的 原始 数据 为 : [45, 'Python', [49, 62, 'addstr1'], '93.7', 'str', 'addstr'] 
>>> arr test[2]-'test tidai" 

>>> print(' 再 一 次 修改 后 的 原始 数据 为 : ,arr_test) 

再 一 次 修改 后 的 原始 数据 为 : [45, Python 'test tidai', '93.7', 'str', 'addstr] 

>>> print(' 利 用 copy.copy 命令 后 ， 再 一 次 修改 后 的 数据 为 : ,A) 

利用 copy.copy 命令 后 , 再 一 次 修改 后 的 数据 为 : [45, 'Python', [49, 62, 'addstr11]， 
{name': 'jack', 'sex': 'male", 'str'] 

>>> print(' 利 用 copy.deepcopy 命令 后 ， 再 一 次 修改 的 数据 为 : ,B) 

利用 copy.deepcopy 命令 后 ， 再 一 次 修改 的 数据 为 : [45, 'Python', [49, 62], 
(name*: 'jack', 'sex': 'male", 'str'] 


小 结 


我 们 发 现 想 要 设计 一 门 出 色 的 语言 ， 就 要 从 现实 世界 里 面 去 寻找 、 学 
并 归纳 出 真理 。 
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继承 可 以 把 父 类 的 所 有 功能 都 直接 拿 过 来 ， 这 样 就 不 必 从 零 做 起 ， 子 

类 只 需要 新 增 自己 特有 的 方法 ， 也 可 以 把 父 类 不 适合 的 方法 覆盖 重 写 。 
继承 可 以 一 级 一 级 地 继承 下 来 。 而 任何 类 ， 最 终 都 可 以 追溯 到 根 类 。 
有 了 继承 ， 才 能 有 多 态 。 


习题 


一 、 问 答题 

1. 面向 对 象 程序 设计 的 特点 分 别 是 什么 ? 

2. 假设 c 为 类 C 的 对 象 且 包 含 一 个 私有 数据 成 员 “_name”， 那 么 在 
类 的 外 部 通过 对 象 直接 将 其 私有 数据 成 员 “_name” 的 值 设置 为 kate 的 
语句 可 以 写作 什么 ? 

二 、 程 序 设计 题 

1. 设计 一 个 类 ， 基 类 为 人 ， 要 求 有 三 层 继承 ， 子 类 对 父 类 的 其 中 某 个 
方法 进行 重 写 ， 要 求 采 用 super() 方 法 。 

2. 设计 一 个 二 维 向 量 类 ， 实 现 向 量 的 加 法 、 减 法 以 及 向 量 与 标量 的 乘 
法 和 除法 运算 。 
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LEE 


我 们 做 事情 不 可 能 总 是 正确 的 ， 偶 尔 犯错 在 所 难免 。 我 们 程序 员 也 不 
例外 ， 就 算 经 验 丰富 也 不 可 能 保证 写 出 来 的 代码 完全 没有 问题 ， 另 外 作为 
一 个 合格 的 程序 员 在 编程 时 要 意识 到 一 点 ， 永 远 不 要 相信 我 们 的 用 户 ， 要 
把 用 户 想象 成 黑客 ， 他 们 无 时 无 刻 不 在 想 攻击 我 们 写 的 程序 ， 这 样 我 们 写 
出 来 的 程序 才 会 更 加 安 人 全、 稳定。 那么 出 现 问题 我 们 就 要 想 办 法 去 解决 问 
题 ， 程 序 出 现 逻 辑 错误 ， 或 者 用 户 输 入 不 合法 的 内 容 都 有 可 能 引起 错误 ， 
而 这 些 错 误 并 非 致命 的 ， 不 会 导致 程序 崩溃 ， 我 们 完全 可 以 利用 Python 提 
供 的 异常 机 制 ， 在 错误 出 现时 ， 以 程序 内 部 的 方式 消化 解决 掉 。 


A91 异常 概述 


9.1.1 认识 异常 
异常 就 是 一 个 事件 ， 该 事件 会 在 程序 执行 过 程 中 有 语法 等 错误 时 发 生 ， 
异常 会 影响 程序 的 正常 执行 。 
通常 在 Python 无 法 正常 处 理 程序 时 就 会 发 生 一 个 异常 ， 程序 会 终止 执行 。 
当 Python 程序 发 生 异 常 时 ， 我 们 需要 检测 捕获 处 理 它 。 
9.1.2 处理 异常 


如 何 检测 并 处 理 异 常 呢 ? 
我 们 检测 处 理 异 常 ， 可 以 通过 try 语句 来 实现 ， 任 何 出 现在 try 语句 范 
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围 内 的 异常 都 可 以 被 检测 到 , 有 4 种 模式 的 try 语句 , 它们 分 别 是 try-except 
语句 、try-except-finally 语句 、ry-except-else 语句 、try (with) -except 语句 。 
1. try-except 语句 
语法 格式 如 下 : 
try: 
[语句 块 ] 
except Exception[as reason]: 
出 现 异常 (exception) 后 的 处 理 代码 


在 语法 格式 中 ,“[ 语 句 块 ]” 属 于 try 语句 的 检测 范围 ， 它 类 似 于 while 
循环 、for 循环 、ibelse 语句 ，except 后 面 跟 上 一 个 异常 的 名 字 ，as reason 
报 出 异常 的 具体 内 容 ， 并 把 这 详细 异常 信息 输出 ;“ 出现 异常 (exception) 
后 的 处 理 代码 ”这 部 分 是 程序 员 对 出 现 异 常 后 如 何 处 理 的 代码 。 

示例 如 下 所 示 : 

try: 

f= open(' 测 试 异常 .txt') 
print(f.read()) 
f.close() 


except OSError as reason: 
print( 文 件 出 错 的 原因 是 : + str(reason)) 


运行 结果 如 下 : 
文件 出 错 的 原因 是 : [Errno 2] No such file or directory: ' 测 试 异常 .txt' 


在 上 例 中 ,打开 的 文件 “测试 异常 .txt” 不 存在 时 ,程序 就 抛 出 了 异常 ， 
并 且 输 出 异常 的 具体 原因 。 
一 个 try 语句 还 可 以 和 多 个 except 语句 搭配 , 对 我 们 感 兴趣 的 异常 进行 
检测 处 理 。 
代码 如 下 所 示 : 
try: 
test str = 25 + '9' 
f= open(' 测 试 异常 txt) 
print(f.read()) 
f.close() 
except OSError as reason: 
print( 文 件 出 错 的 原因 是 :+ str(reason)) 
except TypeError as reason: 


Print( 文 件 出 错 的 原因 是 :' str(reason)) 
运行 结果 如 下 : 
文件 出 错 的 原因 是 : unsupported operand type(s) for +: 'int' and 'str' 


在 上 例 程 序 中 ,设置 了 两 种 异常 OSError 和 TypeError 的 检测 处 理 语句 ， 
当 程 序 执行 到 语句 “test_str =25 + '9'” 时 ， 就 跳 转 到 TypeError 处 ， 输 出 int 
和 str 数据 类 型 不 同 不 能 相 加 的 异常 。 
如 果 try 语句 包含 的 异常 没有 出 现在 后 面 跟着 的 except 语句 中 时 , 则 程 
序 直接 报错 输出 异常 的 类 型 。 代 码 如 下 所 示 : 
try: 
int('det") 
test str = 25 + '9' 
f= open(' 测 试 异 常 .txt) 
print(f.read()) 
f.close() 
except OSError as reason: 
Print(' 文 件 出 错 的 原因 是 :' + str(reason)) 
except TypeError as reason: 
print(' 文 件 出 错 的 原因 是 :' + str(reason)) 
运行 结果 如 下 : 
Traceback (most recent call last): 
File "G:/Python/ try_except2.py", line 2, in <module> 
int('det") 
ValueError invalid literal for int() with base 10: "det 
在 上 例 中 ， 在 try 语句 块 中 定义 语句 int Cdet). 想 把 字符 def 转换 为 int 
数据 ， 这 显然 是 错误 的 语法 ， 然 而 后 面 的 except 语句 没有 相应 的 处 理 ， 所 
以 程序 运行 后 就 直接 报 ValueError 错误 。 
当 不 确定 在 try 语句 块 中 会 出 现 哪 一 种 异常 时 , 可 以 在 except 后 面 不 跟 
具体 的 异常 类 型 ， 代 码 如 下 所 示 : 
try: 
int('det") 
test str = 25 + '9' 
f= open(' 测 试 异常 .txt') 
print(f.read()) 
f.close() 
except : 
Print(' 程 序 有 异常 ! ') 
运行 结果 如 下 : 
程序 有 异常 ! 


在 上 例 中 , 当 程 序 执行 到 try 语句 中 , 只 要 检测 到 异常 , 就 跳 转 到 except 
执行 异常 处 理 代 码 ， 输 出 “程序 有 异常 1”。 
上 面 这 种 处 理 方式 不 推荐 采用 ， 因 为 这 样 做 会 隐藏 程序 员 未 想到 的 所 


a 
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有 未 曾 处 理 过 的 错误 。 
有 一 点 一 定 要 注意 ，try 语句 检测 范围 一 旦 出 现 了 异常 ， 剩 下 的 其 他 语 


句 将 不 会 被 执行 。 


如 上 例 中 , 程序 运行 到 try 语句 块 的 第 一 条 语句 int Cdet) 


时 检测 到 异常 ， 程 序 立即 跳 转 到 except 执行 异常 处 理 程序 ， 其 他 程序 代码 


块 就 不 再 执行 了 。 


另外 ， 如 果 要 对 多 个 异常 进行 统一 处 理 ， 可 采用 如 下 的 语法 格式 : 


try: 
[语句 块 ] 


except (Exception1, Exception2, Exception3, ...): 
出 现 异常 (exception) 后 的 处 理 代码 


在 上 述 语 法 中 ， 多 个 异常 之 间 用 逗号 “,” 隔 开 。 
举 个 例子 ， 代 码 如 下 所 示 : 


try: 
test str- 


25 * '9' 


f= open(' 测 试 异 常 .txt) 
print(f.read()) 


f.close() 


except (OSError, TypeError): 
print( 文 件 出 错 了 ! ) 


运行 结果 如 下 : 


文件 出 错 了 ! 


在 上 例 中 ， 对 异常 OSError 和 TypeError 进行 了 统一 处 理 ， 一 旦 检测 到 
try 语句 块 中 的 语句 “test_str =25 +'9'” 或 “f= open(' 测 试 异常 .txt')” 的 异 
常 ， 就 会 跳 转 到 except 处 进行 异常 处 理 。 

2.try -finally 语句 

语法 格式 如 下 : 


try: 
[语句 块 ] 


except Exception[as reason]: 
出 现 异 常 (exception) 后 的 处 理 代码 


finally: 


无 论 如 何 都 会 被 执行 的 代码 
在 上 述 语法 中 ， 如 果 一 旦 检测 到 try 语句 块 中 有 任何 异常 ， 程 序 就 会 根 
据 异 常 类 型 跳 转 到 except 处 执行 对 应 异常 类 型 的 处 理 代 码 ， 最 后 再 跳 转 到 


finally 处 执行 里 面 的 代码 ; 如 果 在 try 语句 块 中 没有 检测 到 任何 异常 ， 程 序 


在 执行 完 try 语句 


块 里 的 代码 后 , 跳 过 except 中 的 语句 块 ,最 后 跳 转 到 finally 


处 执行 里 面 的 代码 。 


代码 如 下 所 示 : 
try: 
f= open('G:\\testexcept.txt','w') 
Print(f.write(' 测 试 内 容 ! 7) 
test str = 25 + '9' 
except (OSError, TypeError): 
print( 文 件 出 错 了 ! ) 
finally: 
fclose() 


运行 结果 如 下 : 


5 

文件 出 错 了 ! 

打开 文件 G:\testexcept.txt 后 显示 内 容 如 下 : 
测试 内 容 ! 


在 上 例 中 , 将 语句 fcloseO 放 到 了 finally 语句 块 中 , 虽然 程序 运行 到 try 
语句 块 中 的 “test_str = 25 + '9'” 检 测 到 异常 后 ， 跳 转 到 except 处 执行 了 异 
常 处 理 代码 ， 最 后 再 跳 转 到 finally 语句 处 执行 了 代码 £close), 使 程序 写 入 
文件 内 容 成 功 并 关闭 了 新 创建 的 文件 。 

3. try — except - else 语句 

语法 格式 如 下 : 

try: 

[语句 块 ] 
except Exception[as reason]: 

出 现 异常 (exception) 后 的 处 理 代码 
else: 
没有 异常 后 被 执行 的 代码 

在 上 述 语法 中 ， 如 果 一 旦 检测 到 try 语句 块 中 有 任何 异常 ， 程 序 就 会 根 
据 异常 类 型 跳 转 到 except 处 执行 对 应 异常 类 型 的 处 理 代 码 ， 最 后 终止 程序 
的 执行 ， 如 果 在 try 语句 块 中 没有 检测 到 任何 异常 ， 程 序 在 执行 完 try 语句 
块 里 的 代码 后 ， 跳 转 到 else 处 执行 里 面 的 代码 。 

代码 如 下 所 示 : 


print(int( 732") 
except ValueError as reason: 

print( 出 错 了 。N 出 错 的 原因 是 : '+ str(reason)) 
else: 
print( 没 有 任何 异常 ! ) 


运行 结果 如 下 : 
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732 

没有 任何 异常 ! 

在 上 述 程序 中 ，try 语句 块 中 没有 检测 到 任何 异常 ， 程 序 在 执行 完 try 
语句 块 中 的 语句 后 ， 跳 转 到 else 语句 处 执行 里 面 的 代码 ， 输 出 “没有 任何 
异常 1”。 

4. try (with) -except 语句 

语法 格式 如 下 : 


with < 语句 > as name: 
[语句 块 ] 
except Exception[as reason]: 
出 现 异常 (exception) 后 的 处 理 代码 
在 语法 中 可 见 ，with 语句 出 现在 try 语句 块 中 ， 一 般 情 况 下 就 不 用 再 写 
finally 语句 块 了 。 使 用 with 语句 的 最 大 好 处 是 减少 代码 量 ， 如 当 我 们 对 文 
件 操作 时 忘记 了 关闭 文件 操作 ， 则 with 语句 会 自动 执行 关闭 文件 操作 。 
代码 如 下 所 示 : 
try: 
with open('G:Wdata.txt',w") as f: 
fwrite(" 测 试 with 功能 ! ") 
for each line in f: 
print(each line) 
except OSError as reason: 
print(' 出 错 的 原因 是 : '  str(reason)) 
运行 结果 如 下 : 
出 错 的 原因 是 : not readable 


在 上 述 程序 中 ,没有 执行 打开 文件 的 操作 ,所 以 在 执行 语句 for each. line 
inf 时 ,程序 检测 到 了 异常 ， 然 后 跳 转 到 except 处 执行 里 面 的 代码 ， 最 后 程 
序 自动 执行 了 关闭 文件 G:\data.txt 的 操作 ， 这 是 因为 在 try 语句 块 中 使 用 了 
with 语句 。 


9.1.3” 抛 出 异常 


主动 抛 出 异常 ， 使 用 关键 字 raise 来 实现 。 

语法 格式 如 下 : 

raise Exception(defineexceptname) 

在 上 述 语法 中 ，Exception 为 异常 名 称 ，defineexceptname 为 自 定义 的 异 
常 描述 。 


示例 如 下 所 示 : 
raise ZeroDivisionError('1 除 以 0') 


运行 结果 如 下 : 
Traceback (most recent call last): 
File "<pyshell#3>", line 1, in <module> 
raise ZeroDivisionError('1 除 以 0') 
ZeroDivisionError: 1 除 以 0 
在 例子 中 ， 我 们 用 关键 字 raise 自 定 义 了 名 为 “1 RA 0”, 280873 


ZeroDivisionError 的 异常 。 


9.2 ”异常 处 理 流程 


Python 中 的 异常 处 理 流程 如 下 : 

当 程序 运行 try 语句 块 检测 到 异常 时 ， 立 即 终止 有 异常 的 语句 的 执行 ， 
跳 转 到 匹配 该 异常 的 except 子 句 执行 异常 处 理 代码 ， 异 常 处 理 完毕 后 ， 如 
果 有 finally 语句 就 执行 该 语句 块 中 的 代码 ， 最 后 终止 整个 程序 的 执行 ， 如 
果 没 有 finally 语句 就 直接 终止 整个 程序 的 执行 。 

如 果 检 测 到 异常 ， 但 没有 该 异常 匹配 的 except 子 句 ， 分 两 种 情况 ;如 
果 有 finally 语句 就 执行 该 语句 块 中 的 代码 ， 最 后 终止 整个 程序 的 执行 ， 如 
ARX finally 语句 ， 就 直接 终止 整个 程序 的 执行 。 

如 果 在 try 语句 块 中 没有 检测 到 异常 ， 程 序 执行 完 try 语句 块 后 ， 如 果 
有 else 语句 块 就 执行 里 面 的 内 容 ,最 后 控制 流 就 通过 整个 try 语句 ,没有 else 
语句 ， 控 制 流 就 直接 通过 整个 try 语句 。 


9.3” 自 定义 异常 
在 自 定义 异常 前 ， 先 来 了 解 Python 的 异常 继承 关系 ， 如 图 9.1 所 示 。 


IOErmor. TypeError, ValueError, SyntaxError... 


9.1 Python 异常 继承 关系 


KeyboardInterrupt 


e— 
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在 图 9.1 P, Python 的 异常 的 基 类 是 BaseException， 在 程序 异常 抛 出 
的 错误 信息 IOEror、TypeError、ValueError、SyntaxError 等 继承 的 是 
Exception， 因 此 我 们 自 定义 类 也 必须 继承 Exception 。 
自 定义 一 个 简单 的 异常 类 ， 如 下 所 示 : 


class MyError(Exception): 

pass 
在 程序 代码 中 使 用 关键 字 raise 来 抛 出 自 定 义 的 异常 。 
语法 格式 如 下 : 


raise MyException(defineexceptname) 


在 上 述 语法 中 ，MyException 为 自 定义 异常 的 类 型 ，defineexceptname 
为 自 定义 异常 的 说 明 。 
示例 代码 如 下 所 示 : 
>>> class Myerror(Exception): 
pass 
>>> raise Myerror(' 自 定义 的 异常 ') 
运行 结果 如 下 : 
Traceback (most recent call last): 
File "<pyshell#15>", line 1, in <module> 
raise Myerror(' 自 定义 的 异常 ') 
Myerror: 自 定义 的 异常 
在 例子 中 ， 我 们 自 定义 了 异常 类 Myerror， 用 关键 字 raise 抛 出 了 异常 ， 
并 对 自 定 义 异常 做 了 说 明 。 
同时 ， 我 们 也 可 以 结合 try-except 主动 抛 出 自 定义 的 异常 ， 如 下 例 代码 
所 示 : 
class Myerror(Exception): 
pass 


try: 
raise Myerror(' 测 试 自 定义 的 异常 ') 
except Myerror as e: 
print(e) 


运行 结果 如 下 : 
测试 自 定义 的 异常 
9.4 实验 
9.4.1 利用 try-except 处 理 除数 为 零 的 异常 


捕获 除数 为 零 的 异常 ， 使 用 的 语法 结构 为 try-except-else。 


实验 代码 如 下 : 


try: 
i=float(input( 请 输入 被 除数 : )) 
j=float(input 请 输入 除数 : )) 
num-float(i/j) 
except ZeroDivisionError as reason: 
print(' 出 错 了 ! 除数 不 能 为 0! 错误 详细 提示 为 : ,str(reason)) 
except Exception as reason: 
print(' 错 误 的 原因 是 : "str(reason)) 
else: 
print("%.2f 除 以 %.2f 等 于 %.2f' 96 (ijj,num)) 


实验 结果 如 下 被 除数 不 为 0): 


请 输入 被 除数 : 78 
请 输入 除数 : 12 
78.00 除 以 12.00 等 于 6.50 


实验 结果 如 下 被 除数 为 0): 


请 输入 被 除数 : 456 
请 输入 除数 : 0 
出 错 了 ! 除数 不 能 为 0! 错误 详细 提示 为 : float division by zero 


9.4.2” 自 定义 异常 的 使 用 


自 定义 异常 的 步骤 如 下 : 

(D 自 定义 异常 类 ， 它 继承 于 内 置 的 异常 基 类 Exception. 
(2) 使 用 关键 字 raise 抛 出 自 定义 异常 ， 语 法 格式 如 下 : 
raise 自 定义 异常 类 名 ( 自 定义 异常 说 明 ) 


(3) 也 可 以 结合 try-except 进行 捕获 异常 处 理 。 
实验 代码 如 下 : 


# 自 定义 异常 类 
class Myexcept(Exception): 
pass 
# 定 义 函 数 
def test except(status): 
if status--True: 
raise Myexcept('This is my difine except error!') 


else: 
return 
try: 
test_except(Truej# 触 发 异常 
except Myexcept as e: 
print(e) 


else: 


print(" 程 序 没有 异常 发 生 ! ") 
实验 运行 结果 如 下 : 
This is my difine except error! 


9.4.3 raise 关键 字 的 使 用 


关键 字 raise 用 于 自 定义 异常 ， 主 动 抛 出 异常 。 
常用 语法 格式 如 下 : 

raise 异常 类 型 ( 自 定义 异常 说 明 ) 

(1) 抛 出 的 异常 名 称 没 有 定义 过 或 者 不 是 内 置 的 异常 。 
实验 代码 如 下 : 

»»»raise mytestexcept("testexcept") 

实验 结果 如 下 : 


Traceback (most recent call last): 
File "<pyshell#0>", line 1, in «module» 
raise mytestexcept("testexcept") 
NameError: name 'mytestexcept' is not defined 


(2) 抛 出 的 异常 名 称 已 定义 过 或 者 是 内 置 的 异常 。 
实验 代码 如 下 : 

>>> raise Exception("testexcept") 

实验 结果 如 下 : 


Traceback (most recent call last): 
File "«pyshell&12", line 1, in «module» 
raise Exception("testexcept") 
Exception: testexcept 


9.4.4 内置 异常 处 理 语句 的 使 用 


内 置 异常 的 名 字 都 是 以 Error 结尾 , 如 IOError, TypeError, ValueError， 
SyntaxError ZeroDivisionErrorIndexError 等 。 
如 果 知 道具 体 的 内 置 异 常 名 字 ， 就 有 针对 性 地 具体 处 理 ， 如 果 不 知道 
具体 的 异常 名 字 信 息 ， 就 以 默认 的 方式 全 部 捕获 。 
实验 代码 如 下 : 
try: 
f= open('Gi\ test.txt,'w') 
fwrite( 这 是 测试 数据 ) 
fi-open('GA test.bxt'/r) 


teststr=1+f1 
except OSError as reason: 
print( 文 件 出 错 的 原因 是 : "str(reason)) 
except TypeError as reason: 
print( 这 是 类 型 错误 的 提示 信息 : 'str(reason)) 
except Exception as reason: 
print( 异 常 的 原因 是 : str(reason)) 
finally: 
fclose() 
实验 结果 如 下 : 


这 是 类 型 错误 的 提示 信息 : unsupported operand type(s) for +: 'int' and 
”io.TextlOWrapper 


9.5 ”小结 


在 Python 中 ， 若 程序 在 运行 时 出 错 ， 系 统 会 自动 地 在 出 错 的 地 方 生成 
一 个 异常 对 象 ， 而 后 系统 会 在 出 错 的 地 方向 后 寻找 是 否 有 对 这 个 异常 对 象 
处 理 的 代码 ， 如 果 没 有 ， 系 统 会 将 这 个 异常 对 象 抛 给 其 调用 函数 ， 这 样 层 
层 抛 出 ， 如 果 在 程序 主 函 数 中 仍然 没有 对 这 个 异常 对 象 处 理 的 代码 ， 系 统 
会 将 整个 程序 终止 ， 并 将 错误 的 信息 输出 。 


习题 


一 、 问 答题 

1. Python 异常 处 理 结构 有 哪儿 种 形式 ? 

2. 异常 和 错误 是 同一 概念 吗 ? 为 什么 ? 

二 、 程 序 设 计 题 

定义 一 个 异常 类 ， 实 现 的 功能 为 : 打开 一 个 文本 文件 ， 输 出 文件 内 
容 ， 用 异常 捕获 、 处 理 可 能 发 生 的 错误 。 
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文件 操作 


我 们 知道 大 多 数 程序 都 遵循 输入 、 处 理 到 输出 的 模型 ， 首 先 接收 用 户 
输入 ， 然 后 按照 要 求 进行 处 理 ， 到 最 后 输出 数据 。 那 么 到 目前 为 止 ， 我们 
已 经 学 习 了 如 何 处 理 数据 这 一 大 块 环节 ， 然 后 打印 出 想 要 的 结果 ， 不 过 此 
时 我 们 不 再 满足 于 使 用 input 接收 用 户 输入 ， 使 用 print 打印 输出 结果 ， 我 
们 人 迫切 想 要 的 是 关注 到 系统 的 方方面面 ， 需 要 所 写 的 代码 去 自动 分 析 操 作 
系统 的 日 志 ， 需 要 把 分 析 的 结果 保存 为 一 个 新 的 文本 ， 甚 至 我 们 需要 和 外 
界 进 行 交 流 等 ， 这 就 需要 用 到 文件 。 那 么 什么 是 文件 呢 ? Windows 是 以 扩 
展 名 指出 文件 是 什么 类 型 的 。 文 件 相 关 的 操作 将 在 本 章 介绍 。 


10.1 打开 文件 


Python 使 用 内 置 函数 open0 打 开 文 件 ， 创 建 file 对 象 。 在 系统 中 ， 只 有 
存在 file 对 象 后 ， 用 户 才能 对 文件 进行 相应 的 操作 。 

语法 格式 如 下 : 

file object = open(file name [, access mode][, buffering]) 

O file name: 访问 文件 的 字符 串 值 ， 必 选 参数 项 。 

口 access mode: 访问 文件 的 模式 ， 可 选 参数 项 。 默 认 访问 是 只 


BE). 
O buffering: 设置 文件 缓冲 区 ， 可 选 参数 项 。 默 认 缓冲 区 大 小 是 
4096 字 节 。 


以 默认 只 读 方式 打开 一 个 文件 ， 代 码 如 下 所 示 : 


>>> str1 = open("G:Wstr file.txt") 
以 只 读 模式 打开 文件 时 ， 文 件 名 称 必须 要 包含 完整 路 径 ， 否 则 系统 会 
提示 错误 ， 如 下 所 示 : 


>>> str2 = open('str file.txt") 
Traceback (most recent call last): 
File "<pyshell#1>", line 1, in <module> 
Str2 = open("str_file.txt") 
FileNotFoundError: [Errno 2] No such file or directory: 'str_file.txt' 


10.1.4. 文件 模式 


访问 文件 的 模式 有 读 、 写 、 追 加 等 。 以 不 同 模式 打开 文件 ， 详 细 功能 
如 表 10.1 所 示 。 


表 10.1 访问 文件 的 模式 


Bx 描 述 

r 以 只 读 方 式 打开 文件 ， 为 系统 默认 模式 

1b 以 只 读 方 式 、 二 进 制 格式 打开 文件 

rk 打开 一 个 文件 ， 用 于 读 写 

Tb+ 以 二 进 制 格式 打开 一 个 文件 ， 用 于 读 写 。 一 般 用 于 非 文本 文件 
打开 一 个 文件 ， 用 于 写 入 。 如 果 该 文件 不 存在 ， 系 统 则 创建 新 文件 ， 如 

w 果 该 文件 已 经 存在 ， 系 统 则 打开 文件 ， 并 从 文件 头 开 始 编辑 ， 原 有 文件 
信息 会 被 删除 
以 二 进 制 格式 打开 一 个 文件 ， 用 于 写 入。 如 果 该 文件 不 存在 ， 则 创建 新 

wb 文件 ， 如 果 该 文件 已 经 存在 ， 系 统 则 打开 文件 ， 并 从 文件 头 开始 编辑 ， 


原 有 文件 信息 会 被 删除 。 一 般 用 于 非 文 本 文件 
打开 一 个 文件 ， 用 于 读 写 。 如 果 该 文件 不 存在 ， 系 统 则 创建 新 文件 ， 如 


wt 果 该 文件 已 经 存在 ， 系 统 则 打开 文件 ， 并 从 文件 头 开始 编辑 ， 原 有 内 容 
会 被 删除 
以 二 进 制 格式 打开 一 个 文件 ， 用 于 读 写 。 如 果 该 文件 不 存在 ， 系 统 则 创 
wb 建新 文件 ， 如 果 该 文件 已 经 存在 ， 系 统 则 打开 文件 ， 并 从 文件 头 开始 编 


辑 ， 原 有 内 容 会 被 删除 。 一 般 用 于 非 文本 文件 


打开 一 个 文件 ， 用 于 追加 。 如 果 该 文件 不 存在 ， 系 统 则 创建 新 文件 进行 


a 写 入 ; 如 果 该 文件 已 经 存在 ， 文 件 指针 在 结尾 ， 新 的 信息 将 会 被 添加 到 
已 有 内 容 之 后 
以 二 进 制 格式 打开 一 个 文件 ， 用 于 追加 。 如 果 该 文件 不 存在 ， 系 统 则 创 
ab 建新 文件 进行 写 入 ; 如 果 该 文件 已 经 存在 ， 文 件 指针 在 文件 结尾 ， 新 的 


内 容 将 会 被 添加 到 已 有 内 容 之 后 
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续 表 
模式 描述 
打开 一 个 文件 ， 用 于 读 写 。 如 果 该 文件 不 存在 ， 系 统 则 创建 新 文件 用 于 
at 读 写 ， 如 果 该 文件 已 经 存在 ， 文 件 指针 将 会 放 在 文件 结尾 ， 新 的 信息 将 
会 被 添加 到 已 有 内 容 之 后 
以 二 进 制 格式 打开 一 个 文件 ， 用 于 追加 。 如 果 该 文件 不 存在 ， 系 统 则 创 
ab+ 建新 文件 用 于 读 写 ， 如果 该 文件 已 经 存在 ， 文 件 指针 将 会 放 在 文件 的 结 


尾 ， 新 的 信息 将 会 被 添加 到 已 有 内 容 之 后 


例如 ， 以 写 模式 打开 并 创建 一 个 文件 ， 如 下 所 示 : 
>>> Str file = open("G:Wile test.txt","w") 


10.1.2. 文件 缓冲 区 


Python 文件 缓冲 区 ， 一 般 分 为 3 种 模式 : 全 缓冲 、 行 缓冲 、 无 缓冲 。 

O 全 缓冲 : 默认 情况 下 ，Python 文件 写 入 采用 全 缓冲 模式 ， 空 间 
大 小 为 4096 字 节 。 前 4096 个 字 节 的 信息 都 会 写 在 缓冲 区 中 ， 
当 第 4097 个 字 节 写 入 时 , 系统 会 把 先前 的 4096 个 字 节 通过 系 
统 调用 写 入 文件 。 同 样 ， 可 以 用 Buffering=n (单位 为 : 字 节 ) 
自 定 义 缓冲 区 的 大 小 。 

口 行 缓冲 : Buffering=1， 系 统 每 遇 到 一 个 换行 符 〈'\n') 时 才 进 行 
系统 调用 ， 将 缓冲 区 的 信息 写 入 文件 。 

O 无 缓冲 : Buffering=0， 当 需要 将 系统 产生 的 信息 实时 写 入 文件 
时 ， 就 需要 设置 为 无 缓冲 的 模式 。 


102 基本 的 文件 方法 
10.2.1 读 和 写 


1. read() 方 法 
语法 格式 如 下 : 
String = fileobject.read([size]); 


size: 从 文件 中 读 取 的 字 节 数 ， 如 果 未 指定 ， 则 读 取 文 件 的 全 部 信息 。 
返回 值 为 从 文件 中 读 取 的 字符 串 。 

代码 如 下 所 示 : 

>>> Str 2 = open("G:Wstr file.txt","r") 

>>> Sir test = str 2.read() 

>>> print(str test) 


这 是 一 个 测试 程序 ! 
>>> str test.close() 
2. write() 方 法 

语法 格式 如 下 : 
fileobject.write(string); 


write() 方 法 将 字符 串 写 入 一 个 打开 的 文件 。 

write() 方 法 不 会 自动 在 字符 串 的 末尾 添加 换行 符 《〈"n')， 需 要 人 为 在 字 
符 串 末尾 添加 换行 符 。 

write() 方 法 的 应 用 代码 如 下 所 示 : 

>>> Sir 1 = open("G:Wstr file.txt","w") 

>>> str_1.write(" 这 是 一 个 测试 程序 ! Wn") 

str 1.close() 


10.2.2 ZRF 


1. readline() 方 法 

该 方法 用 于 从 文件 中 读 取 整 行 ， 包 括 "m" 字 符 。 
语法 格式 如 下 : 

String = fileObject.readline([size]) ; 


Size: 从 文件 中 读 取 的 字 节 数 ， 如 果 参 数 为 正 整数 ， 则 返回 指定 大 小 的 
字符 串 数据 。 
readline() 方 法 的 应 用 如 下 所 示 : 


>>> str1 = open("GNstr file1.txt","w") 
>>> str1.write("1. 第 一 行 测试 数据 ;\n2. 第 二 行 测试 数据 ;\n") 
22 

>>> str1.close() 

>>> str2 = open("G:\\str_file1.txt","r") 
>>> string1 = str2.readline() 

>>> print(string1) 

1. 第 一 行 测试 数据 ; 

>>> string2 = str2.readline(6) 

>>> print(string2) 

2. 第 二 行 测试 数据 ; 


>>> Str2.close() 


2. readlines() 方 法 
该 方法 用 于 读 取 文 件 中 所 有 行 ， 直 到 结束 符 EOF， 并 返回 列表 ， 包 括 
所 有 行 的 信息 。 该 列表 可 以 由 Python 的 for... in .结构 进行 处 理 。 
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readlines() 方 法 的 语法 如 下 : 
fileObject.readlines() ; 


readlines() 方 法 的 应 用 代码 如 下 所 示 : 


str3 = open("G:\\str_file1.txt","r") 
for line in str3.readlines(): 

line = line.strip() 

print(line) 
str3.close() 


运行 结果 如 下 : 


==== RESTART: G:/Python/ readlines.py ==== 
1. 第 一 行 测试 数据 ; 
2. 第 二 行 测试 数据 


10.2.3 ”关闭 文件 


Close() 方 法 用 于 关闭 文件 ， 并 清除 文件 缓冲 区 中 的 信息 ， 关 闭 文件 后 
不 能 再 进行 写 入 。 

语法 格式 如 下 : 

fileObject.close(); 


当 一 个 文件 对 象 的 引用 被 重新 指定 给 另 一 个 文件 时 ， 系 统 会 关闭 先前 
打开 的 文件 。 


10.2.4 文件 重 命 


rename() 方 法 用 于 将 当前 文件 名 称 重 新 命名 为 一 个 新 文件 名 称 。 
语法 格式 如 下 : 
os.rename(current filename, new. filename) 


Q current filename: 当前 文件 的 名 称 。 

Q new_filename: 重新 命名 后 的 文件 名 称 。 

需要 注意 的 是 ， 要 使 用 这 个 内 置 函数 rename()， 必 须 先导 入 os 模块 ， 
然后 才 可 以 调用 相关 的 功能 。 

rename() 方 法 的 应 用 如 下 所 示 : 


>>> import os 
>>> os.rename("G:\\str_file.txt","G:\\str_file2.txt") 


上 例 将 已 经 存在 的 文件 str. file.txt 重 命名 为 str_file2 txt. 


10.2.5 删除 文件 


ITemove() 方 法 用 于 删除 系统 中 已 经 存在 的 文件 。 

语法 格式 如 下 : 

os.remove(file name) 

file name: 系统 中 已 经 存在 的 文件 名 称 ， 即 将 删除 的 文件 名 称 。 
需要 注意 的 是 ， 要 使 用 这 个 内 置 函数 remove), VEFA os 模块 ， 


然后 才 可 以 调用 相关 的 功能 。 


remove() 方 法 的 应 用 如 下 所 示 : 


>>> import os 
>>> os.remove("G:Mfile test.txt") 


上 例 将 已 经 存在 的 文件 G:Mile test.ext 删除 。 


10.3 String 1/0 函数 
10.3.1 输出 到 屏幕 


语法 格式 如 下 : 
print([string] [,string]) 
sting: 为 可 选 参数 ， 零 个 或 多 个 用 逗号 隔 开 的 表达 式 。 其 中 ， 如 果 是 


数学 表达 式 ， 则 直接 计算 出 结果 。 


print(O 方 法 的 应 用 如 下 所 示 : 


>>> print("Python 是 一 门 简单 易学 的 语言 An",12.5+987) 
Python 是 一 门 简单 易学 的 语言 ! 

999.5 
>>> print() 


上 例 中 ， 直 接 输 出 了 字符 串 数据 ， 同 时 也 将 表达 式 计 算出 结果 后 再 输 
当 没 有 参数 时 ， 就 输出 一 个 空格 。 


10.3.2， 读 取 键盘 输入 


入 ， 返 回 的 是 运算 结果 。 返 回 的 结果 作为 对 象 供 系统 引用 。 


语法 格式 如 下 : 
input([keystring]) 
keystring: 可 以 接收 从 键盘 输入 的 字符 串 ， 也 可 以 将 一 个 表达 式 作为 输 
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input() 方 法 的 应 用 如 下 所 示 : 
>>> str = input(" 请 从 键盘 输入 : ") 
请 从 键盘 输入 : Python 编程 实践 
>>> print(str) 

Python 编程 实践 

>>> input(345+987) 

1332 


上 例 演 示 了 两 种 应 用 场景 : (1) 获取 从 键盘 中 输入 的 字符 串 ， 并 返回 
一 个 对 象 输出 到 屏幕 ， (2) 输入 一 个 数学 表达 式 ， 然 后 返回 计算 结果 。 


10.4 基本 的 目录 方法 
10.4.1 创建 目录 


mkdir(0) 方 法 的 语法 格式 如 下 : 

os.mkdir("newdir") 

newdir: 新 建 的 目录 名 称 ， 必 须要 带 目录 的 完整 路 径 。 

需要 注意 的 是 , 要 使 用 目录 操作 相关 的 内 置 函数 , 必须 先导 入 os 模块 ， 
然后 才 可 以 调用 相关 的 功能 。 

os.mkdir() 方 法 的 应 用 如 下 所 示 : 


>>> import os 
>>> os.mkdir("G:West dir") 


上 例 中 ， 先 将 os 模块 导入 系统 中 ， 然 后 调用 mkdir() 方 法 在 G BR H 
录 新 建 名 为 test. dir 的 文件 夹 。 


10.4.2 ”显示 当前 工作 目录 


getcwd() 方 法 的 语法 格式 如 下 : 
os. getcwd() 

显示 当前 的 工作 目录 。 
os.getcwd() 方 法 的 应 用 如 下 所 示 : 


>>> import os 
>>> os.getcwd() 
'C:\\Users\\Lenovo\\AppData\\Local\\Programs\\Python\\Python36-32' 


上 例 中 ， 先 将 os 模块 导入 系统 中 ， 然 后 调用 getcwd() 方 法 显示 当前 工 
作 目 录 。 


10.4.3 改变 目录 


chdir( 方 法 的 语法 格式 如 下 : 
os.chdir("newdir") 
newdir: 要 改变 的 新 的 工作 目录 名 称 ， 需 要 带 目录 的 完整 路 径 。 


os.chdir() 方 法 的 应 用 如 下 所 示 : 


>>> import os 

>>> os.getcwd() 
'C:\\Users\\Lenovo\\AppData\\Local\\Programs\\Python\\Python36-32' 
>>> os.chdir("G:\\") 

>>> os.getcwd() 


'GW 


fin, 


先 将 os 模块 导入 系统 中 ， 调 用 getewd0 方 法 显示 当前 的 工作 


目录 ， 然 后 改变 当前 的 工作 目录 为 G 盘 根 目录 ， 最 后 用 getcwd() 方 法 验证 


操作 结果 。 


10.4.4 ”删除 目录 


rmdir() 方 法 的 语法 格式 如 下 : 
os.rmdir("dirname") 
dirname: 要 删除 的 目录 名 称 ， 需 要 带 目 录 的 完整 路 径 。 


os.Imdir() 方 法 的 应 用 如 下 所 示 : 


>>> import os 
>>> os.rmdir("GAnew dir") 


上 例 中 ， 


先 将 os 模块 导入 系统 中 , 调用 mmdir() 方 法 删除 目录 G:\new_dir。 


10.5 ”实验 
10.5.1 文件 操作 


文件 的 操作 包括 读 、 写 、 打 开 、 关 闭 等 基本 操作 。 
实验 任务 : 将 文件 〈 网 络 安全 培训 .txt) 中 的 数据 进行 分 割 并 按照 以 下 
规律 保存 起 来 ， 文 中 分 为 以 下 3 部 分 。 


(1) 网 
(2) 网 


(3) 网 


络 安全 形势 与 政策 解读 。 
络 安全 建设 与 信息 安全 防护 。 
络 安全 人 才 培 养 和 与 情 应 对 。 请 分 别 以 3 部 分 的 标题 作为 文件 
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名 保存 起 来 。 
实验 代码 如 下 所 示 : 


def save_file(contentstr,titlestr): # 保 存 文件 
file name ='G://test//'+ str(titlestr)  '.txt 
file = open(file name,'w) 
file.writelines(contentstr) 
file.close() 
def split file(file name): # 分 割 文件 
f = open(file name) 
dbz-[] 
count=0 
# 标 题 
title str = [1, 网 络 安全 形势 与 政策 解读 ,'2, 网 络 安全 建设 与 信息 安全 防护 ','3、 
网 络 安 全 人 才 培 养 和 与 情 应 对 ] 
for each line in f: 
if str(each line).find(title str[count]) != -1:# 找 出 标题 
if len(db) !=0:# 有 段落 内 容 ， 且 遇 到 了 下 一 段落 标题 
save file(db,str(tile str[count-1])) 
db-[] 
if count « 2: 
count +=1 
else: 
db.append(each line) 
save file(db,str(title str[count])) 
print( 文 件 分 割 完毕 ! ) 
fclose() 
split_file('G:// 网 络 安全 培训 .txt') 


实验 运行 结果 如 下 : 
文件 分 割 完毕 ! 

匀称 

Ej 1、 网 络 安全 形势 与 政策 解 污 bd 


图 >、 网 洛 安全 建设 与 信息 安全 防护 ,bt 
图 3、 网 络 安全 人 才 培 养 和 奥 情 应 对 .bt 


10.5.2 ”目录 操作 

实验 任务 : 用 户 输入 要 遍历 的 目录 ， 以 函数 的 实现 方式 实现 遍历 目录 
下 的 文件 。 

实验 代码 如 下 所 示 : 

import os,sys # 导 入 系统 模块 


def dirpaths(path):# 定 义 遍历 目录 的 函数 
path_collection=[] 
for dirpath,dirnames,filenames in os.walk(path): 
for file in filenames: 
fullpath-os.path.join(dirpath,file) 
path collection.append(fullpath) 
return path collection 
str_path=str(input(' 请 输入 要 遍历 的 目录 路 径 :“))# 输 入 要 遍历 的 目录 
for files in dirpaths(str_path):# 输 出 遍历 目录 的 文件 
print (files) 


实验 运行 结果 如 下 : 


请 输入 要 遍历 的 目录 路 径 : CA 
C:WDocuments|Tencent 
Files103652482XCloudResB37DC41B7146C5BAC789C9B9C8E3083C 


10.5.3 1/0 函数 的 使 用 


实验 任务 : 通过 函数 argv[] 接 收 外 部 程序 的 输入 要 遍历 的 目录 ， 并 输出 
"e FH 文件 。 
实验 代码 如 下 所 示 : 
import os,sys # 导 入 系统 模块 
path=sys.argv[1] # 从 程序 外 部 获取 参数 
for dirpath,dirnames,filenames in os.walk(path): 365 FIR TXH 
for file in filenames: 
fullpath-os.path.join(dirpath,file) 
print (fullpath) # 输 出 文件 的 完整 路 径 
实验 步骤 如 下 : 
CD 将 文件 命名 为 10 5_3.py， 保 存在 c:\Users\Administrator 目录 下 。 
(2) 在 系统 “开始 ”菜单 “Windows 系统 ”选项 中 单 击 “ 命 令 提示 符 ”， 
如 图 10.1 所 示 〈 笔 者 的 计算 机 操作 系统 是 Windows 10)。 


命令 提示 符 


图 10.1 命令 提示 符 窗口 
(3) 在 命令 提示 符 下 输入 以 下 实验 命令 : 
10 5 3.py G:\ 
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(4) 实验 运行 结果 如 下 所 示 : 


G:N10 5 2.py 
G:\\data.txt 

Gstr file.txt 

Gstr file1.txt 
G:Westexcept.txt 
G:Westexcept.txt.txt. 


\ 10.6 小结 


我 们 在 本 章 中 系统 学 习 了 文件 的 读 写 操作 、 文 件 的 各 种 系统 操作 以 及 

在 保存 文件 时 ， 如 果 遇 到 列表 、 字 典 、 集 合 ， 甚 至 类 的 实例 这 些 更 加 
复杂 的 数据 类 型 时 ， 我 们 会 变 得 不 知 所 措 ， 也 许 会 把 这 些 数据 类 型 转换 成 
字符 串 再 保存 到 一 个 文本 文件 中 ， 但 是 如 果 把 这 个 过 程 反 过 来 ， 从 文本 文 
件 恢复 数据 对 象 ， 把 一 个 字符 串 恢复 成 列表 ， 恢 复 成 字典 ， 甚 至 恢复 成 集 
合 、 类 、 类 的 实例 ， 我 们 发 现 这 是 一 件 异 常 困难 的 事情 ， 庆 幸 的 是 Python 
提供 了 一 个 功能 强大 的 标准 模块 “pickle”， 让 我 们 将 非常 复杂 的 数据 类 型 
〈 如 列表 、 字 典 等 ) 转换 为 二 进 制 文件 。 


习题 

一 、 问 答题 

二 进 制 文件 与 文本 文件 有 什么 区 别 ? 

二 、 程 序 设 计 题 

l. 从 键盘 输入 字符 ， 并 把 输入 的 字符 保存 到 磁盘 ， 直 到 输入 字符 句号 
“。” 终 止 输入 为 止 。 

2. 有 两 个 文件 testfilel.txt 和 testfile2.txt， 要 求 把 这 两 个 文件 中 的 内 容 
合并 保存 到 一 个 新 文件 testfile3.txt 中 ， 并 输出 到 屏幕 。 

3. 将 当前 工作 目录 修改 为 “d\” 并 验证 ， 最 后 将 当前 工作 目录 恢复 为 
原来 的 目录 。 
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项 目 实战 : Ren RUE 


大 数据 时 代 ， 数 据 的 采集 是 进行 数据 分 析 的 一 项 重要 前 提 工 作 ， 单 靠 
人 工 获 取 效 率 低下 、 成 本 极 高 。 为 了 提高 数据 采集 的 效率 ， 怜 虫 应 运 而 生 。 
息 虫 又 称 网 络 机 器 人 ， 可 以 代替 人 工 自动 地 从 互联 网 中 采集 、 整 理 数据 。 
在 本 章 中 ， 大 家 将 通过 一 个 简单 的 爬虫 案例 来 学 习 疏 虫 程序 的 相关 知识 。 
另外 ， 通 过 学 习 Scrapy 框架 掌握 如 何 借助 第 三 方 库 来 实现 候 虫 程序 的 设计 
流程 。 最后， 通 过 自己 动手 上 机 实践 ,来 巩固 息 虫 框架 Scrapy 的 典型 应 用 。 


11.1 EREHE 


候 虫 又 称 网 络 师 蛛 、 网 络 蚂蚁 、 网 络 机 器 人 等 ， 它 可 以 不 受 人 工 干 涉 
自动 按照 既定 规则 浏览 互联 网 中 的 信息 。 我 们 把 这 些 既 定 规则 ， 称 为 疏 虫 
算法 。 使 用 Python 语言 可 以 方便 地 实现 这 些 算 法 ， 编 写 聆 虫 程序 ， 完 成 信 
息 的 自动 获取 。 

【提示 】 

常见 的 网 络 爬 虫 主要 有 百度 公司 的 Baiduspider、360 公司 的 360Spider、 
搜狗 公司 的 Sogouspider、 微 软 公司 的 Bingbot 等 。 


大 数据 时 代 ， 面 对 海量 的 互联 网 数据 ， 如 何 才能 高 效 地 获取 有 用 的 数 
据 呢 ? 怜 虫 便 是 最 好 的 解决 方法 ， 可 以 根据 自己 的 需求 制定 相应 的 规则 ， 
实现 对 应 的 聆 虫 程序 。 进 而 ， 从 Intemet 获取 需要 的 信息 。 未 来 ， 随 着 数据 
量 的 爆炸 性 增长 ， 疏 虫 将 越 来 越 重要 。 下 面 将 通过 爬虫 程序 实战 案例 让 大 
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家 对 这 一 网 络 数据 获取 利器 有 一 定性 的 认识 ， 并 能 够 熟练 地 根据 需求 定制 
规则 ， 完 成 候 虫 程序 的 编程 实现 。 


11.1.1 准备 工作 


通常 ， 在 怜 取 一 个 站 点 之 前 ， 需 要 对 该 站 点 的 规模 和 结构 进行 大 致 的 
了 解 。 站 点 自身 的 robots.txt 和 sitemap 文件 都 能 够 为 我 们 了 解 其 构成 提供 
有 效 的 帮助 。 

1. robots 文件 

一 般 情况 下 ， 大 部 分 站 点 都 会 定义 自己 的 robots XF, MEZ FIER 
按照 自己 的 意图 爬 取 相 关 数 据 。 因 而 ， 在 爬 取 站 点 之 前 ， 检 查 robots 文件 ， 
能 够 使 我 们 了 解 该 站 点 的 限制 条 件 ， 做 到 有 的 放 矢 ， 提 升 怜 虫 成 功 获取 数 
据 的 概率 。 同 时 ， 还 有 可 能 通过 此 文件 了 解 站 点 结构 的 相关 信息 ， 使 我 们 
有 针对 性 地 设计 息 虫 程序 ， 完 成 数据 的 获取 工作 。 

2. sitemap 文件 

站 点 提供 的 sitemap LIFEN T SEA 3s ex (OH CAS » "CL e S TT Hi 
AF P B fts SK E Dor SEM PER. MEIER. MAT. heb fd 
有 可 能 存在 更 新 不 及 时 或 不 完整 的 情况 ， 因 而 在 使 用 sitemap 时 需要 谨慎 
应 对 。 

3. 估算 站 点 规模 

目标 站 点 的 大 小 会 影响 我 们 聆 取 的 效率 。 通 常 可 以 通过 百度 搜索 引擎 
的 site 关键 字 过 滤 域 名 结果 ， 从 而 获取 百度 怜 虫 对 目标 站 点 的 统计 信息 。 


【提示 】 
在 www.baidu.com 对 应 的 搜索 输入 框 中 输入 “site: 目标 站 点 域名 ”， 
即 可 获取 相关 统计 信息 。 


11.1.2. ERX 


网 络 朴 虫 按照 实现 的 技术 和 结构 可 以 分 为 通用 网 络 朴 虫 、 聚 焦 网 络 疏 
虫 、 增 量 式 网 络 朴 虫 和 深层 网 络 爬 虫 。 实 际 的 网 络 疏 虫 系统 通常 是 由 这 几 
种 爬虫 组 合 而 成 。 下 面 对 这 4 种 常见 的 朴 虫 类 型 进行 简单 介绍 。 

OBAME, HAERERE. 主要 由 初始 URL 集合 、URL 队列 、 
页 面 怜 行 模块 、 页 面 分 析 模 块 、 页 面 数据 库 以 及 链接 过 滤 模 块 构成 。 该 类 
型 的 怜 虫 获取 的 目标 资源 在 整个 互联 网 中 ， 其 目标 数据 量 庞大 ， 疏 行 的 范 
围 广泛 。 正 是 由 于 这 种 特性 ， 此 类 怜 虫 对 性 能 的 要 求 非常 高 。 它 主要 用 在 
大 型 的 搜索 引擎 中 ， 如 百度 搜索 ， 具 有 比较 高 的 应 用 价值 。 
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(2) HERE, 344378 UZR E, 3EXEBHIAR URL 集合 、URL 
WMA Wit BER. WTR, VIDERE. SEBDSDUERRER. WWW 
评价 模块 以 及 链接 评价 模块 构成 。 是 一 种 按照 预先 定义 好 的 主题 有 选择 地 
进行 网 页 疏 取 的 网 络 疏 虫 。 与 通用 网 络 爬 虫 相 比 ， 它 的 目标 数据 只 和 预定 
义 的 主题 相关 ， 怜 行 的 范围 相对 固定 ， 对 网 络 带 宽 资源 及 服务 器 资源 要 求 
较 低 ， 主 要 用 于 特定 信息 的 获取 。 

G) 增 量 式 网 络 息 虫 ， 主 要 由 本 地 页 面 URLE, FET URL 集 、 本 
地 页 面 集 、 息 行 模块 、 排 序 模块 以 及 更 新 模块 构成 。 是 指 对 已 下 载 网 页 采 
取 增 量 式 更 新 和 只 息 行 新 产生 的 或 者 已 经 发 生变 化 网 页 的 息 虫 ， 它 能 够 在 
一 定 程 度 上 保证 所 息 行 的 页 面 是 尽 可 能 新 的 页 面 。 和 周期 性 仆 行 和 刷新 页 
面 的 网 络 怜 虫 相 比 ， 增 量 式 怜 虫 只 会 在 需要 的 时 候 疏 行 新 产生 或 发 生 更 新 
的 页 面 ， 并 不 重新 下 载 没 有 发 生变 化 的 页 面 ， 可 有 效 减少 数据 下 载 量 ， 及 
时 更 新 已 朴 行 的 网 页 ， 减 小 时 间 和 空间 上 的 耗费 ， 但 是 增加 了 怜 行 算法 的 
复杂 度 和 实现 难度 。 

(4) RENKER, EEH URL 列表 、LVS Ade. feries. fT 
器 、LVS 控制 器 、 表 单 分 析 器 、 表 单 处 理 器 以 及 响应 分 析 器 构成 。 其 中 LVS 
是 指标 签 /数值 集合 ， 用 来 表示 填充 表单 的 数据 源 。 是 一 种 用 于 怜 取 互联 网 
中 深层 页 面 的 疏 虫 程序 。 和 通用 网 络 怜 虫 相 比 ， 深 层 页 面 的 怜 取 ， 需 要 想 
办 法 自动 填写 对 应 的 表单 ， 因 而 ， 深 层 网 络 爬 虫 的 核心 在 于 表单 的 填写 。 


【提示 】 

互联 网 中 页 面 按 存 取 方 式 可 分 为 两 类 : 表层 页 面 和 深层 页 面 。 表 层 页 
面 是 指 不 需要 提交 表单 ， 使 用 静态 链接 能 够 到 达 的 静态 页 面 ， 深 层 页 面 则 
是 指 需 要 提交 表单 ， 使 用 动态 链接 才能 够 到 达 的 动态 生成 页 面 。 例 如 ， 网 
络 中 的 信息 查询 页 面 。 


11.1.3 ERRE 


不 同 的 怜 虫 程序 ， 其 实现 原理 也 不 尽 相 同 。 但 这 些 实现 原理 有 许多 的 
相似 之 处 ， 即 我 们 通常 所 说 的 “共性 ”。 基 于 此 ， 本 节 用 一 个 通用 的 网 络 候 
虫 结构 来 说 明 疏 虫 的 基本 工作 流程 ， 如 图 11.1 所 示 。 其 基本 工作 流程 如 下 : 

COD 按照 预定 主题 ， 选 取 一 部 分 精心 挑选 的 种 子 URL. 

(2) 将 种 子 URL 放 入 待 抓 取 的 URL 队列 中 。 

(3) 从 待 抓 取 URL 队列 中 依次 读 取 种 子 URL， 解 析 其 对 应 的 DNS， 
并 得 到 对 应 的 主机 IP, $ URL 对 应 的 网 页 下 载 下 来 ， 并 存 入 已 下 载 网 页 数 
据 库 中 ， 随 后 将 已 访问 的 种 子 URL 出 队 ， 放 入 已 抓 取 URL 队列 中 。 


(4) 分 析 已 抓 取 队列 中 的 URL， 从 已 下 载 网 页 数据 中 分 析出 其 他 的 
URL， 并 和 已 抓 取 的 URL 进行 重复 性 比较 。 最 后 ， 将 去 重 过 的 URL 放 入 
待 抓 取 的 URL 队列 中 ， 重 复 步骤 G) 和 (4) 操作 ， 直 至 待 抓 取 URL. 队 
列 为 空 。 


种 已 
子 抓 
URL 取 

URL 


图 11.1 疏 虫 工作 流程 示意 图 
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众所周知 ，Python 语言 属于 胶水 语言 ， 可 扩展 性 强 。 用 Python 2858 
虫 程 序 的 最 大 好 处 就 是 其 本 身 有 很 多 实用 的 第 三 方 库 ， 免 去 了 我 们 自己 实 
现 相应 功能 的 环节 。Python ERA 3 个 比较 实用 的 库 : Requests, Beautiful 
Soup fll Lxml， 为 我 们 编写 怜 虫 程序 提供 了 必 不 可 少 的 技术 支持 ， 下 面 逐 一 
介绍 。 


11.2.1 Requests 库 


用 Requests 实现 HTTP 请 求 非常 简单 ,操作 也 相当 人 性 化 .因此 ,Python 
中 常用 Requests 来 实现 HTTP 请 求 过程 ， 它 也 是 在 Python ERF R rn decis 
用 的 方式 。 

1. Requests 库 的 安装 

Requests 库 是 第 三 方 模块 ， 需 要 额外 进行 安装 。 源 代码 位 于 
http://www.python-requests.org/en/master/, 使 用 Requests 库 需 要 先进 行 安装 ， 
常用 的 安装 方式 有 以 下 两 种 。 

COD 第 一 种 方式 : 使 用 pip 进行 安装 。 命 令 为 pip install requests. 

(2) 第 二 种 方式 : 直接 到 官网 http://www.python-requests.org/en/master/ 
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下 载 最 新 发 行 版 ， 然 后 解压 缩 文件 夹 , 运行 setup.py 即 可 。 这 里 采用 第 二 种 
安装 方式 ， 具 体操 作 步 骤 如 下 。 

Q 打开 Requests 官方 网 站 ， 如 图 11.2 所 示 。 
Requests: HITP for Humans 


Release v2.18.4. (Installation) 


Requests is the only Non-GMO HTTP library for Python, safe for human consumption. 


Note: 


The use of Python 3 is highly preferred over Python 2. Consider upgrading your 
applications and infrastructure if you find yourself still using Python 2 in production 
Ostar 32,164 today. If you are using Python 3, congratulations — you are indeed a person of excellent 


taste. —Kenneth Reitz 
Requests is an elegant and 


11.2 Requsets 库 官方 网 站 


Q) 单 击 Python 标签 ， 打 开 下 载 界面 ， 选 择 Navigation 下 的 Download 


files 菜单 ， 选 择 requests.targz 压缩 包 ， 单 击 下 载 ， 如 图 11.3 所 示 。 
requests 2.18.4 


pip install requests ® 


Python HTTP for Humans. 


Navigation Download files 


Download the file for your platform. If you're not sure which to choose, learn more about installing packages 


eshe 


24748) sase 


图 11.3 Requests 库 下 载 页 面 
@ 解压 requests.tar.gz 安装 包 ， 通 过 命令 运行 安装 包 中 的 setup.py 文件 。 
【提示 】 
Requests 库 安 装 成 功 与 否 检查 方法 : 在 Python 的 Shell 中 输入 import 
requests， 如 果 不 报错 ， 则 安装 成 功 ， 如 图 11.4 所 示 。 


B 

File Edit Shell Debug Options Window Help 

Python 3.6.5 (v3.6,5:f59c0932b4, Mar 28 2018, 17:00:18) (MSC v.1900 64 bit (AMD64)] on win32 
Type "copyright", "credits" or “license()” for more information. 

>>> t requests 

>>> 


图 11.4 验证 Requests 库 安装 


2. Requests 库 的 使 用 
Requests 库 有 7 种 主要 方法 ， 简 单 介 绍 如 下 。 


(I) Requests 库 的 get0 方 法 主要 用 于 获取 HTML. 网 页 ， 相 当 于 HTTP 
的 GET。 其 返回 对 象 response 的 常用 属性 如 表 11.1 所 示 ， 我 们 可 通过 这 些 
属性 获取 要 访问 域名 的 基本 信息 。 


表 11.1 response 属性 


属 d. 说 — 明 
HTTP 请 求 的 返回 状态 ，200 表示 链接 成 功 ，404 表示 
r.status code i: 
a 失败 
Ttext HTTP 响应 内 容 的 字符 串 形 式 ， 即 url 对 应 的 页 面 内 容 
r.encoding JA HTTP header 中 猜测 的 响应 内 容 编码 方式 


从 内 容 中 分 析出 的 响应 内 容 的 编码 方式 
HTTP 响应 内 容 的 二 进 制 形式 


r.apparent encodin: 


r.content 


下 面 使 用 get0 方 法 来 演示 如 何 通过 其 返回 对 象 response 来 获取 
www.baidu.com 域名 的 基本 信息 ， 示 例 代码 如 下 : 


>>> import requests 

>>> r = requests.get("http://www.baidu.com") 

>>> print(r.status_code) 

200 

>>> print(r.text) 

«IDOCTYPE html» 

«I..STATUSOK..» «html» 
【鉴于 代码 篇 幅 较 长 ， 此 处 省 略 www.baidu.com 页 面 代码 】 

</html> 

>>> print(r.encoding) 

ISO.8859.1 

>>> print(r.apparent_encoding) 

utf.8 

>>> print(r.content) 

b'«IDOCTYPE html» Wn«l.. STATUS OK..»«html» 
【鉴于 代码 篇 幅 较 长 ， 此 处 省 略 www.baidu.com 页 面 代码 】 

</html>\r\n' 


如 上 代码 所 示 ，requests 对 象 的 get0) 方 法 返回 的 response XJ $$ r, 38x 
printO 函 数 打印 的 属性 值 ， 我 们 便 可 获取 网 站 域名 的 相关 信息 。 

(2) Requests 库 的 head() 方 法 主要 用 于 获取 HTML. 网 页 头 信息 ， 相 当 
T HTTP 的 HEAD。 

例如 ， 抓 取 百 度 首页 的 头 部 信息 ， 示 例 代 码 如 下 : 

>>> import requests 

>>> r = requests.head(http://www.baidu.com') 


>>> r.headers 
{Cache.Control': 'private, no.cache, no.store, proxy.revalidate, no.transform', 


-一 全 


"Connection : 'Keep.Alive', 'Content.Encoding*: 'gzip', 'Content. Type": 'text/html', 
'Date': 'Tue, 19 Jun 2018 05:35:22 GMT', 'Last.Modified: 'Mon, 13 Jun 2016 
02:50:40 GMT', 'Pragma':'no.cache', 'Server' 'bfe/1.0.8.18') 

>>> rtext 


>>> 


如 上 代码 所 示 , 首先 导入 requests 包 , 然后 调 上 


head() FÁ Xi , 3& [E] response 


对 象 z， 最 后 ， 通 过 引用 r 的 相关 属性 ， 显 示 对 应 网 址 的 相关 信息 。 


(3) Requests 库 的 post() 方 法 主要 用 于 向 HTTP 网 页 提交 POST 请 求 ， 


相当 于 HTTP 的 POST。 这 里 ,我 们 给 指定 的 rl 地 址 http://httpbin.org 用 post() 
方法 添加 sendinfo 信息 ， 示 例 代 码 如 下 : 


ET 


>>> import requests 

>>> sendinfo = ('name"lily', 'sex'"female") 

>>> r = requests.post(http;//httpbin.org/post', data = sendinfo) 

>>> print(r.text) 

('args"() , "data" , "files" , "form"("name""lily' , "sex":"female"} , 
"headers"("Accept""*/^ ,  "AcceptEncoding""gzip ， deflate" , 
"Connection":"close" " "Content.Length":"20" Ü 
"Content.Type":"application/x. www.form.urlencoded" ,  "Host";"httpbin.org" , 
"User.Agent":"python.requests/2.18.4"), "json":null, "origin";*113.123.80.176", 
"url""http://httpbin.org/post") 


>>> 


由 以 上 代码 的 交互 式 输出 结果 , 我 们 不 难 发 现 , 字典 sendinfo 以 form 
的 形式 被 发 送 给 response 对 象 ,这 里 也 可 以 直接 向 url 地 址 发 送 字符 串 ， 


示例 如 下 : 


>>> r = requests.post('http://httpbin.org/post", data = 'i am string") 

>>> print(r.text) 

('args":(, "data":"i am string", "files", "form":Q, "headers":("Accept":"*/*", 
"Accept.Encoding";"gzip, deflate", "Connection""close", "Content.Length":"11", 
"Host":"httpbin.org" , "User.Agent":"python.requests/2.18.4") , "json":null , 
"origin": 113.123.80.176", "url""http-//httpbin.org/post") 


>>> 


从 代码 的 交互 式 输出 结果 不 难 发 现 ， 字 符 串 以 “data: iam string" sE 


对 被 保存 下 来 。 


(4) Requests 库 的 put0 方 法 主要 用 于 向 HTML 网 页 提交 PUT 请 求 , 相 


当 于 HTTP 的 PUT. 


例如 ， 给 指定 的 put0 方 法 添加 字典 sendinfo 信息 ， 示 例 代码 如 下 : 


>>> sendinfo = {name"."lily’, 'sex'"female') 
>>> r = requests.put(http://httpbin.org/put', data = sendinfo) 


>>> print(r.text) 

{"args":{} , "data""", "files":{} , "form":("name":"lily" ， "sex":"female"} , 
"headers"("Accept""*/^" ， "Accept .Encoding""gzip , deflate" ， 
"Connection";"close" c "Content.Length":"20" E 


"Content. Type":"application/x. www.form.urlencoded" ,  "Host""httpbin.org" , 
"User.Agent":"python.requests/2.18.4"), "json":null, "origin";"113.123.80.176", 
"url":"http://httpbin.org/put") 


同样 ， 由 上 述 交 互 输 出 可 以 看 出 ，put0 也 是 用 form 表单 的 方式 存储 自 
定义 的 字典 ， 并 返回 response 对 象 。 

(5) Requests 库 的 patch() 方 法 主要 用 于 向 HTML 网 页 提交 局 部 修改 请 
求 ， 相 当 于 HTTP 的 PATCH. 例如 ， 用 patch() 方 法 修改 刚才 put0 方 法 添加 
的 字典 sendinfo 。 


>>> sendinfo = ('name""berry', 'sex'"female') 

>>> r = requests.patch('http;//httpbin.org/patch', data = sendinfo) 

>>> print(r.text) 

('args"( , "data", "files , "form":{"name":"berry" , "sex":"female"} , 
"headers"("Accept""*/^ ,  ""AcceptEncoding""gzip ， deflate" , 
"Connection":"close" "Content. Length":"21" E 
"Content. Type":"application/x.www.form.urlencoded" ,  "Host";"httpbin.org" 
"User.Agent":"python.requests/2.18.4"), "json":null, "origin";"113.123.80.176", 
"url";"http://httpbin.org/patch") 


由 上 述 代 码 可 知 ， 通 过 patch() 方 法 我 们 成 功 将 字典 中 的 name 值 修改 
成 功 。 

(6) Requests 库 的 delete() 方 法 主要 用 于 向 HTML 页 面 提交 删除 请 求 ， 
相当 于 HTTP 的 DELETE。. 例 如 ,我 们 删除 刚才 patch0 方 法 修改 后 的 sendinfo 
字典 ， 示 例 代 码 如 下 : 

>>> r-requests.delete("https://httpbin.org/delete") 

>>> print(r.text) 

{"args":{} , "data" , "files":{} , "form" , "headers":{"Accept":"*/*”， 

"Accept.Encoding";"gzip, deflate", "Connection":"close", "Content.Length":"O", 


"Host":"httpbin.org" , "User.Agent""python.requests/2.18.4") , "json":null , 
"origin":"113.123.80.176", "url";"https://httpbin.org/delete") 


由 以 上 代码 执行 结果 可 以 看 出 ，form 表单 的 内 容 为 空 ， 说 明 我 们 删除 
成 功 。 


(7) Requests 库 的 request() 方 法 ， 主 要 用 来 构造 一 个 请 求 ， 支 撑 以 上 各 
个 基础 方法 。 

通常 使 用 下 面 的 格式 来 完成 该 方法 的 调用 。 

Requests.request(method, url, **kwargs) 


其 中 ，method 是 指 请 求 方式 ， 对 应 上 面 所 讲 的 get. put. post05977 
法 ; url 代表 目标 页 面 的 url 链接 地 址 。**kwargs 代表 控制 访问 参数 ， 共 13 
个 。 例 如 params 参数 ， 代 表 字 典 或 字 节 序列 ， 可 作为 参数 增加 到 url 中 。 
代码 演示 如 下 : 


>>> sendinfo = ('name""lily', 'sex':'female'} 
>>> r = requests.request('PUT', 'http;//httpbin.org/put', data = sendinfo) 


>>> print(r.text) 

{"args":{} , "data""" , "files":{} , "form":{"name":"lily” , "sex":"female"} , 
"headers":{"Accept":™*/*”" ， EN Encoding""gzip , deflate" , 
"Connection":;"close" "Content.Length":"20" o 


"Content. Type":"application/x. www.form.urlencoded" , "Host":"httpbin.org" , 
"User.Agent":"python.requests/2.18.4"), "json":null, "origin";"113.123.80.176", 
"url";"http;//httpbin.org/put") 


由 以 上 示例 代码 可 以 看 出 , 通过 通用 request() 方 法 , 可 以 包装 出 通用 的 
接口 , 来 模拟 requests. 对 象 常用 方法 的 功能 。 另外 , request0 方 法 的 **kwargs 
参数 属于 可 选 。 其 他 参数 具体 的 使 用 方法 有 兴趣 的 读者 可 以 参照 Requests 
文档 进行 学 习 。 鉴 于 篇 幅 关 系 ， 这 里 不 再 歼 述 。 

3. 谎 取 定向 网 页 的 通用 代码 框架 

在 以 上 Requests 库 的 学 习 基础 之 上 ， 总 结 基 于 Requests 3E H A Ut fe rh 
程序 模板 框架 如 下 : 

import requests 

def getHTMLText(url): 

try: 

r-requests.get(url, timeout 230) 

rraise for status() # 如 果 状 态 码 不 是 200， 引 发 HTTPError 异常 

rencoding= rapparent_encoding 

return rtext 

except- 

return" 产 生 异 常 " 

if name --" main " # 限定 getHTMLText() 只 在 所 定义 的 文件 中 执行 

rl ="http://www.baidu.com" 

print(getHTMLText(url)) 


方便 大 家 按照 统一 的 编程 风格 编写 程序 ， 提 高 通用 代码 的 可 读 性 。 


(7) Requests 库 的 request() 方 法 ， 主 要 用 来 构造 一 个 请 求 ， 支 撑 以 上 各 
个 基础 方法 。 

通常 使 用 下 面 的 格式 来 完成 该 方法 的 调用 。 

Requests.request(method, url, **kwargs) 


其 中 ，method 是 指 请 求 方式 ， 对 应 上 面 所 讲 的 get. put. post05977 
法 ; url 代表 目标 页 面 的 url 链接 地 址 。**kwargs 代表 控制 访问 参数 ， 共 13 
个 。 例 如 params 参数 ， 代 表 字 典 或 字 节 序列 ， 可 作为 参数 增加 到 url 中 。 
代码 演示 如 下 : 


>>> sendinfo = ('name""lily', 'sex':'female'} 
>>> r = requests.request('PUT', 'http;//httpbin.org/put', data = sendinfo) 


>>> print(r.text) 

{"args":{} , "data""" , "files":{} , "form":{"name":"lily” , "sex":"female"} , 
"headers":{"Accept":™*/*”" ， EN Encoding""gzip , deflate" , 
"Connection":;"close" "Content.Length":"20" o 


"Content. Type":"application/x. www.form.urlencoded" , "Host":"httpbin.org" , 
"User.Agent":"python.requests/2.18.4"), "json":null, "origin";"113.123.80.176", 
"url";"http;//httpbin.org/put") 


由 以 上 示例 代码 可 以 看 出 , 通过 通用 request() 方 法 , 可 以 包装 出 通用 的 
接口 , 来 模拟 requests. 对 象 常用 方法 的 功能 。 另外 , request0 方 法 的 **kwargs 
参数 属于 可 选 。 其 他 参数 具体 的 使 用 方法 有 兴趣 的 读者 可 以 参照 Requests 
文档 进行 学 习 。 鉴 于 篇 幅 关 系 ， 这 里 不 再 歼 述 。 

3. 谎 取 定向 网 页 的 通用 代码 框架 

在 以 上 Requests 库 的 学 习 基础 之 上 ， 总 结 基 于 Requests 3E H A Ut fe rh 
程序 模板 框架 如 下 : 

import requests 

def getHTMLText(url): 

try: 

r-requests.get(url, timeout 230) 

rraise for status() # 如 果 状 态 码 不 是 200， 引 发 HTTPError 异常 

rencoding= rapparent_encoding 

return rtext 

except- 

return" 产 生 异 常 " 

if name --" main " # 限定 getHTMLText() 只 在 所 定义 的 文件 中 执行 

rl ="http://www.baidu.com" 

print(getHTMLText(url)) 


方便 大 家 按照 统一 的 编程 风格 编写 程序 ， 提 高 通用 代码 的 可 读 性 。 


11.2.2 BeautifulSoup 库 


BeautifulSoup 库 是 用 Python 语言 编写 的 一 个 HTML/XML 的 解释 器 。 
它 可 以 很 好 地 处 理 不 规范 的 标记 并 生成 剖析 树 (parse tree)， 其 本 身 提 供 了 


程 时 间 。 本 节 主 要 介绍 如 何 使 用 该 库 处 理 不 规范 的 标记 ， 按 照 指定 格式 输 
出 对 应 的 文档 。 

1. BeautifulSoup 的 安装 

BeautifulSoup 库 和 了 Requests 库 的 安装 方式 类 似 ， 有 两 种 方式 。 第 一 种 
是 使 用 pip install. 命令 进行 安装 。 第 二 种 是 到 官网 下 载 , 运行 Setup.py 文件 。 
这 里 采用 第 一 种 安装 方式 。 在 “命令 提示 符 ” 窗 口中 运行 安装 命令 ， 具 体 
如 下 : 

pip install beautifulsoup4 

安装 过 程 如 图 11.5 所 示 。 


图 11.5 BeautifulSoup 安装 
这 里 安装 的 是 Beautiful Soup 4.4.6.0 版 本 。 
2. Beautiful Soup 基本 操作 
(1) 创建 BeautifulSoup 对 象 
创建 BeautifulSoup 对 象 时 ， 首 先 得 导入 其 对 应 的 bs4 库 ， 格 式 如 下 : 
from bs4 import BeautifulSoup 


下 面 通过 一 个 简单 的 例子 来 演示 该 库 的 使 用 。 


首先 创建 一 个 用 来 完成 演示 的 html 字符 串 ， 其 定义 了 一 个 标准 的 
HTML 文档 ， 也 就 是 BeautfiulSoup 对 象 的 数据 源 ， 如 下 所 示 : 

html = ww 

<html><head><title>The Dormouse's story</title></head> 

<body> 

<p class="title" name="dromouse"><b>The Dormouse's story</b></p> 


<p class-"story"Once upon a time there were three little sisters; and their 
names were 

«a href-"http://example.com/elsie" class-"sister" id-"link1"»«!.. Elsie ..></a>, 
«a href-"http://example.com/lacie" class-"sister" id="link2">Lacie</a> and 

«a href-"http://example.com/tillie" class-"sister" id="link3">Tillie</a>; 

and they lived at the bottom of a well.«/p» 

<p class-"story"-...«/p» 


接 下 来 创建 BeautifulSoup XJ $ : 
soup = BeautifulSoup(html, "Ixml") 


另外 ， 也 可 以 用 本 地 存在 的 HTML 文件 (如 名 为 index.html 的 文件 ) 
来 创建 soup 对 象 ， 其 格式 如 下 : 

soup = BeautifulSoup(open(index.html)) 

这 里 需要 注意 路 径 问 题 。 下 面 通过 soup 对 象 的 格式 化 函数 格式 化 输出 
soup 对 象 中 的 内 容 : 

print(soup.prettify()) 

输出 如 下 结果 : 


<html> 
<head> 
<title> 
The Dormouse's story 
</title> 
</head> 
<body> 
<p class="title" name="dromouse"> 
<b> 
The Dormouse's story 
«Ib» 
«Ip» 
<p class-"story"» 
Once upon a time there were three little sisters; and their names were 
«a class-"sister" hrefz"http://example.com/elsie" id="link1"> 
<l.. Elsie ..> 
<la> 
, 
«a class-"sister" href-"http://example.com/lacie" id-"link2"» 
Lacie 
«la» 
and 
«a class-"sister" href-"http://example.com/tillie" id="link3"> 
Tillie 
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</a> 


and they lived at the bottom of a well. 
«Ip» 
<p class-"story"» 


a: 

</body> 

</html> 

以 上 便 是 soup 对 象 格式 化 输出 的 方式 ，prettify0 函 数 是 我 们 通过 soup 
对 象 分 析 HTML 文档 的 第 一 步 ， 大 家 一 定 要 熟练 掌握 该 函数 的 用 法 。 

(2) BeautifulSoup 库 的 对 象 

通常 ，BeautifulSoup 库 用 于 将 一 个 复杂 HTML 文档 转换 成 一 个 复杂 的 
树 形 结构 , 每 个 节点 都 是 一 个 Python 对 象 ,根据 功能 划分 ,将 BeautifulSoup 
库 的 对 象 可 分 为 4 类 ， 具 体 包 括 如 下 。 


© Tag 
Tag 相当 于 HTML 中 的 一 个 标签 : 
# 提取 Tag 


>>> print(soup.title) 

«title» The Dormouse's story</title> 

>>> print (type(soup.title)) 

«class 'bs4.element.Tag'» 

XT Tag. A name 和 attrs 两 个 重要 的 属性 ， 使 用 方法 分 别 如 下 。 
O name: 每 个 Tag 对 象 的 name 属性 就 是 标签 本 身 的 名 称 。 
例如 ， 超 链接 标签 a 的 name: 


>>> print(soup.a.name) 


>>> 


O attrs: 每 个 Tag 对 象 的 attrs 属性 就 是 一 个 字典 , 包含 了 标签 的 
全 部 属性 。 
例如 ， 超 链接 a 的 attrs 属性 : 


>>> print(soup.a.attrs) 

{href: 'http://example.com/elsie', 'class' [sister],  'id': "link1') 

>>> 

(2) NavigableString 

使 用 Tag 对 象 ， 我 们 已 经 得 到 了 标签 的 内 容 。 那 么 ， 要 想 获取 标签 内 
部 的 文字 该 怎么 办 呢 ? 很 简单 , 用 string 即 可 , 其 类 型 为 NavigableString， 
示例 如 下 : 
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>>> print (soup.p.string) 

The Dormouse's story 

>>> print(type(soup.p.string)) 

«class 'bs4.element.NavigableString' 
>>> 


(3) BeautifulSoup 

BeautifulSoup 对 象 表示 的 是 一 个 文档 的 全 部 内 容 。 大 部 分 时 候 ， 可 以 
把 它 当 作 Tag 对 象 ， 是 一 个 特殊 的 Tag, 我 们 可 以 分 别 获取 它 的 名 称 、 类 型 
以 及 属性 。 接 本 节 例 子 输出 如 下 : 


>>> print(soup.name) 
[document] 

>>> print(type(soup.name)) 
«class 'str'> 

>>> print (soup.attrs) 

出 


>>> 


@ Comment 

Comment 对 象 是 一 个 特殊 类 型 的 NavigableString 对 象 ， 其 实际 输出 
的 内 容 仍然 不 包括 注释 符号 ， 但 是 如 果 不 好 好 处 理 它 ， 可 能 会 对 我 们 的 文 
本 处 理 造成 意 想不到 的 麻烦 。 从 本 节 开 始 所 定义 的 数据 源 html 字符 串 中 ， 
我 们 找 一 个 带 有 注释 的 a 标签 ， 如 下 所 示 : 

«a href-"http://example.com/elsie" class-"sister" id="link1"><!.. Elsie ..></a>, 

从 而 进行 相关 操作 : 

>>> print(soup.a) 

«a class="sister" href="http://example.com/elsie" id="link1"><!.. Elsie ..></a> 

>>> print(soup.a.string) 

Elsie 


>>> print(type(soup.a.string)) 
«class 'bs4.element.Comment'> 


由 上 述 示例 代码 运行 结果 可 知 ， 其 注释 输出 只 显示 其 中 的 内 容 。 
3. 遍历 文档 


这 里 重点 学 习 搜索 文档 树 的 find_all0 方 法 。 参 照 BeautifulSoup 库 的 帮 
助 文档 ， find_all0 方 法 的 标准 格式 如 下 : 


find_all( name , attrs , recursive , text , **kwargs ) 


现 对 其 带 有 指定 参数 的 使 用 方法 通过 示例 介绍 如 下 。 


(1) name 参数 
name 参数 可 以 查找 所 有 名 字 为 name 的 Tag. 字符 串 对 象 自 动 忽略 。 例 


如 ， 我 们 搜索 文档 中 name 为 超 链接 a 的 Tag: 

>>> print (soup.find all('a')) 

[<a class-"sister" href-"http://example.comyelsie" id-"link1"»«l.. Elsie ..></a>, 

«a class-"sister" href-"http://example.com/lacie" id-"link2"»Laciec/a» , <a 

class-"sister" href-"http://example.comftillie" id="link3">Tillie</a>] 

>>> 

另外 ，name 参数 也 可 是 列表 、 正 则 式 或 方法 。 有 具体 示例 分 别 如 下 。 

第 一 种 ，name 参数 为 列表 ， 如 本 例 中 的 [a'，b]。 

>>> print(soup.find all(l'a', 'b'])) 

[<b>The Dormouse's story</b> a «a class-"sister" 

href-"http://example.comv/elsie" id="link1"><!.. Elsie ..></a>, <a class-"sister" 

href-"http://example.com/lacie" id="link2">Lacie</a> , <a class-"'sister" 

href-"http://example.comtillie" id="link3">Tillie</a>] 

>>> 

第 二 种 ，name 参数 为 正则 式 ， 如 本 例 中 的 “Ab'， 以 b 开头 的 标签 都 能 够 
找到 。 

>>> import re 

>>> print(soup.find all(re.compile('^b"))) 

[<body> 

<p class-"title" name="dromouse"><b>The Dormouse's story</b></p> 

<p class-"story"»Once upon a time there were three little sisters; and their 

names were 

«a class-"sister" href-"http://example.com/elsie" idz"link1"»«!.. Elsie ..></a>, 

«a class-"sister" href-"http://example.com/lacie" idz"link2"»Lacie«/a» and 

«a class-"sister" hrefz"http://example.comtillie" id="link3">Tillie</a>; 

and they lived at the bottom of a well.«/p» 

<p class-"story"»...«/p» 

</body>, <b>The Dormouse's story</b>] 

>>> 

第 三 种 ， 传 递 函 数 。 如 果 没 有 合适 的 过 滤器 ， 那 么 还 可 以 定义 一 个 方 
法 ， 方 法 只 接受 一 个 元 素 参 数 ， 如 果 这 个 方法 返回 True 表示 当前 元 素 匹 配 


并 且 被 找到 ， 如 果 不 是 则 返回 False。 下 面 的 方法 校 验 了 当前 元 素 ， 如 果 包 
含 class 属性 却 不 包含 id 属性， 那么 将 返回 Tme， 示 例 代码 如 下 : 


>>> def has_class_but_no_id(tag): 
return tag.has attr('class') and not tag.has attr('id") 
>>> soup.find all(has class but no id) 


[<p class-"title" name-"dromouse"»«b»The Dormouse's story</b></p>, <p 


class-"story"» Once upon a time there were three little sisters; and their names 

were 

«a class-"sister" href-"http-//example.comy/elsie" id-"link1"»«!.. Elsie ..></a>, 

«a class-"sister" href-"http://example.com/lacie" id-"link2"»Lacie«/a» and 

«a class-"sister" href-"http-//example.comftillie" id="link3">Tillie</a>; 

and they lived at the bottom of a well.</p>, «p class-"story"»...«/p»] 

>>> 

(2) keyword 参数 

如 果 一 个 指定 名 字 的 参数 不 是 搜索 内 置 的 参数 名 ， 搜 索 时 会 把 该 参数 
当 作 指定 名 字 Tag 的 属性 来 搜索 ， 如 果 包含 一 个 名 字 为 id 的 参数 ， 
Beautiful Soup 会 搜索 每 个 Tag 的 id 属性。 示例 如下: 

>>> soup.find all(id-'link2") 

[<a class-"sister" href-"http://example.com/lacie" id-"link2"»Lacie«/a»] 

Soup 对 象 会 把 link2 当 作 标签 搜索 所 有 Tag 的 id 属性 。 

如 果 传 入 href 参数 ，Beautiful Soup 会 搜索 每 个 Tag 的 href 属性 ， 示 例 
代码 如 下 : 

>>> soup.find_all(href=re.compile("elsie")) 

[<a class="sister" href="http://example.com/elsie" id="link1"><!.. Elsie ..></a>] 

如 果 使 用 多 个 指定 名 字 的 参数 可 以 同时 过 滤 Tag 的 多 个 属性 ， 示 例 代 
码 如 下 : 

>>> soup.find_all(href=re.compile("elsie"),  id-'link1') 

[<a class="sister" href="http://example.com/elsie" id="link1"><!.. Elsie ..></a>] 

>>> 

Soup 对 象 只 保留 同时 具有 指定 限定 符 的 标签 。 

(3) text 参数 

通过 text 参数 可 以 搜索 文档 中 的 字符 串 内 容 , 与 name 参数 的 可 选 值 一 


样 ，text 参数 接受 字符 串 、 正 则 表达 式 、 列 表 、True 等 参数 。 
示例 代码 如 下 : 
>>> soup.find_all(text="Elsie") 
0 
>>> soup.find_all(text=["Tillie", "Elsie", "Lacie"]) 
[Lacie', "'Tillie'] 


>>> soup.find all(textzre.compile("Dormouse")) 

['The Dormouse's story", "The Dormouse's story"] 

>>> soup.find all(text- True) 

[The Dormouse's story", ^n', ^n', "The Dormouse's story", ^n', 'Once upon 
a time there were three little sisters; and their names werew', 'Elsie', ', W', 
'Lacie', 'andW', 'Tillie', "Anand they lived at the bottom of a well.', ^n', '...', 
^n] 

>>> 


(4) limit 参数 

find_all() 方 法 返回 全 部 的 搜索 结构 , 如 果 文 档 树 很 大 , 那么 搜索 会 很 慢 。 
当 我 们 不 需要 全 部 结果 时 , 可 以 使 用 limit 参数 限制 返回 结果 的 数量 。 效果 
与 SQL 中 的 limit 关键 字 类 似 ， 当 搜索 到 的 结果 数量 达到 limit 的 限制 
时 ， 就 停止 搜索 返回 结果 。 例 如 ， 本 节 开 始 定义 的 html 字符 串 文档 ， 文 档 
树 中 有 3 个 Tag 符合 搜索 条 件 ， 但 结果 只 返回 了 两 个 ， 这 是 由 于 我 们 限制 
了 返回 数量 ， 示 例 代 码 如 下 : 

>>> soup.find_all("a", limit=2) 

[<a class="sister" href="http://example.com/elsie" id="link1"><!.. Elsie ..></a>, 


<a class="sister" href="http://example.com/lacie" id="link2">Lacie</a>] 
>>> 


(5) recursive 参数 

通常 ， 调 用 Tag 的 find_all0 方 法 时 ，BeautifulSoup 会 检索 当前 Tag 的 
所 有 子孙 节点 ， 如 果 只 想 搜索 ,Tag 的 直接 子 节点 ， 可 以 使 用 参数 
recursive=False， 示 例 代码 如 下 : 

>>> soup.html.find all("title") 


[«title»* The Dormouse's story</title>] 
>>> soup.html.find all("title", recursive-False) 


>>> 


该 代码 显示 了 是 否 使 用 recursive 参数 的 区 别 。 另 外 ，find 还 有 许多 衍 
生 的 方法 。 这 里 就 不 再 一 一 叙述 ， 如 有 和 需要， 可 参阅 beautifulsoup 的 帮助 
文档 。 


11.2.3 Lxml Æ 


前 面 已 经 学 习 了 Requests 和 BeautifulSoup 库 的 相关 操作 ， 下 面 再 来 学 
习 另 一 种 高 效 的 网 页 解析 的 库 Lxml. Lxml 是 Python 语言 中 和 XML 以 及 
HTML 工作 的 功能 中 最 丰富 和 最 容易 使 用 的 库 。 它 是 另 一 个 Python Jf dh ff 
常用 库 ， 是 基于 libxml2 这 一 XML 解析 库 的 Python 封装 ， 速 度 比 
BeautifulSoup 快 。 

1. Lxml 库 的 安装 

同样 ，Lxml 库 的 安装 方法 和 前 面 介绍 的 BeautifulSoup 的 安装 类 似 ， 
亦 有 两 种 方法 。 这 里 使 用 pip install 命令 进行 安装 : 

pip install Ixml 

安装 成 功 示意 图 如 图 11.6 所 示 。 


11.6 Lxml 安装 成 功 界面 


这 里 安装 的 是 Lxml 4.2.1 版 本 。 
2. Lxml 基本 操作 

首先 通过 一 个 简单 的 例子 了 解 一 下 Lxml 库 是 如 何 解析 如 下 text 字 符 串 
中 的 HTML 文档 。 


text= "" 

<title>The Dormouse's story</title> 

<p class-"title' name="dromouse"><b>The Dormouse's story</b></p> 

<p class-"story"»Once upon a time there were three little sisters; and their 
names were 

«a href-"http://example.comvelsie" class-"sister" id="link1"><!.. Elsie ..></a>, 
«a href-"http://example.com/lacie" class-"sister" id-"link2"»Lacie«/a» and 

«a hrefz"http://example.com/tillie" class-"sister" id="link3">Tillie</a>; 

and they lived at the bottom of a well.«/p» 

<p class-"story"»...«/p» 


旦 序 示例 如 下 : 


>>> from Ixml import etree 

>>> text = "" 

«title» The Dormouse's story</title> 

<p class-"title" name-"dromouse"» «b» The Dormouse's story«/b» «/p» 

<p class-"story"»Once upon a time there were three little sisters; and their 
names were 

«a href-"http://example.comyelsie" class-"sister" id-"link1"«!.. Elsie ..></a>, 
«a href-"http://example.com/lacie" class-"sister" id-"link2"»Lacie«/a» and 

«a href-"http://example.comftillie" class-"sister" id="link3">Tillie</a>; 

and they lived at the bottom of a well.«/p» 

<p class-"story"»...«/p» 

>>> html = etree.HTML (text) 

>>> result = etree.tostring(html) 

>>> print(result) 

b'«html» «head» «title* The DormouseVs story-/title* «/head» «body» «p 
class-"title" name="dromouse"><b>The | DormouseVs story</b></p>\n<p 
class-"story"» Once upon a time there were three little sisters; and their names 


were\n<a href="http://example.com/elsie" class="sister" id="link1"><!.. 
Elsie ..></a> ， \n<a href="http://example.com/lacie" class="sister" 
ink2">Lacie</a> and\n<a href-"http://example.com/tilie" class="sister" 
id="link3">Tillie</a>;\nand they lived at the bottom of a well.</p>\n<p 
class-"story"»...«/p»n«/body» «/html»" 

>>> 


如 上 面 程序 的 运行 结果 , 出 乎 预料 的 是 Lxml 并 没有 格式 化 输出 HTML 
文档 ， 不 过 ， 它 自动 补 齐 了 text 中 缺少 的 HTML 标签 。 那 该 如 何 进行 格式 
化 呢 ? 这 里 使 用 decode0) 函 数 来 完成 格式 化 输出 ， 示 例 代 码 如 下 : 


>>> print(result.decode("utf.8")) 

<html><head><title>The Dormouse's story</title> 

</head><body><p class="title” name="dromouse"><b>The Dormouse's 
story</b></p> 

<p class="story">Once upon a time there were three little sisters; and their 
names were 

«a href-"http://example.com/elsie" class-"sister" id-"link1"»«!.. Elsie ..></a>, 

«a href-"http://example.com/lacie" class-"sister" id-"link2"»Lacie«/a» and 

«a href-"http://example.com/tillie" class-"sister" id="link3">Tillie</a>; 

and they lived at the bottom of a well.«/p» 

<p class-"story"»...«/p» 

</body></html> 


其 次 ， 我 们 来 学 习 如 何 通过 parse() 方 法 读 取 HTML. 文件 。 首 先 定义 一 
个 名 为 text.html 的 HTML 文件 ， 内 容 如 下 : 


<body> 

<p class-"title" name="dromouse"><b>The Dormouse's story</b></p> 

<p class="story">Once upon a time there were three little sisters; and their 
names were 

«a href-"http://example.com/elsie" class-"sister" id="link1"><!.. Elsie ..></a>, 
«a href-"http://example.com/lacie" class-"sister" id-"link2"»Laciec/a» and 

«a hrefz"http://example.com/tillie" class-"sister" id="link3">Tillie</a>; 

and they lived at the bottom of a well.«/p» 

</body> 


然后 ， 编 写 如 下 程序 代码 : 


from Ixml import etree 

html = etree.parse(text.html') 

result = etree.tostring(html, pretty printzTrue) 
print(result.decode("utf.8")) 


运行 结果 如 图 11.7 所 示 。 


注意 : 凡是 涉及 调用 路 径 的 问题 ， 在 IDE 中 编辑 比较 方便 ， 如 本 演示 
案例 。 
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图 11.7. Lxml 库 文件 读 取 功能 演示 
接 下 来 ,我 们 学 习 Lxml 库 中 的 标签 搜索 方法 , 在 Lxml 库 中 可 用 findo, 


findall0 及 xpath() 3 种 方式 搜索 Element 包含 的 标签 对 象 ， 其 区 别 如 下 。 


@find0: 返回 第 一 个 匹配 对 象 ， 其 参数 使 用 的 XPath 语法 只 能 用 相对 


路 径 〈 以 开头 )。 


@findall0: 返回 一 个 标签 对 象 的 列表 ， 其 参数 使 用 的 XPath 语法 只 能 


用 相对 路 径 〈 以 “./” 开 头 )。 


Oxpath(): 返回 一 个 标签 对 象 的 列表 , 其 参数 使 用 的 XPath 语法 既 可 以 


是 相对 路 径 ， 也 可 以 是 绝对 路 径 ， 示 例 程序 如 下 : 


>>> from Ixml import etree 

>>> text = "" 

<title>The Dormouse's story</title> 

<p class="title" name="dromouse"><b>The Dormouse's story</b></p> 

<p class="story">Once upon a time there were three little sisters, and their 
names were 

«a href="http://example.com/elsie" class="sister" id="link1"><!.. Elsie ..></a>, 

«a href="http://example.com/lacie" class-"sister" id="link2">Lacie</a> and 

«a href-"http://example.comftillie" class-"sister" id="link3">Tillie</a>; 

and they lived at the bottom of a well.«/p» 

«p class-"story"»...«/p» 

>>> html = etree.HTML (text) 

>>> result = etree.tostring(html) 

>>> print(result.decode("utf.8")) 

«html» «head»«title* The Dormouse's story</title> 

</head><body><p class="title” ^ name-"dromouse"»«b»The | Dormouse's 
Story</b></p> 

<p class="story">Once upon a time there were three little sisters; and their 
names were 

«a href-"http://example.com/elsie" class-"sister" id-"link1"»«l.. Elsie ..></a>, 
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图 11.7. Lxml 库 文件 读 取 功能 演示 
接 下 来 ,我 们 学 习 Lxml 库 中 的 标签 搜索 方法 , 在 Lxml 库 中 可 用 findo, 


findall0 及 xpath() 3 种 方式 搜索 Element 包含 的 标签 对 象 ， 其 区 别 如 下 。 


@find0: 返回 第 一 个 匹配 对 象 ， 其 参数 使 用 的 XPath 语法 只 能 用 相对 


路 径 〈 以 开头 )。 


@findall0: 返回 一 个 标签 对 象 的 列表 ， 其 参数 使 用 的 XPath 语法 只 能 


用 相对 路 径 〈 以 “./” 开 头 )。 


Oxpath(): 返回 一 个 标签 对 象 的 列表 , 其 参数 使 用 的 XPath 语法 既 可 以 


是 相对 路 径 ， 也 可 以 是 绝对 路 径 ， 示 例 程序 如 下 : 


>>> from Ixml import etree 

>>> text = "" 

<title>The Dormouse's story</title> 

<p class="title" name="dromouse"><b>The Dormouse's story</b></p> 

<p class="story">Once upon a time there were three little sisters, and their 
names were 

«a href="http://example.com/elsie" class="sister" id="link1"><!.. Elsie ..></a>, 

«a href="http://example.com/lacie" class-"sister" id="link2">Lacie</a> and 

«a href-"http://example.comftillie" class-"sister" id="link3">Tillie</a>; 

and they lived at the bottom of a well.«/p» 

«p class-"story"»...«/p» 

>>> html = etree.HTML (text) 

>>> result = etree.tostring(html) 

>>> print(result.decode("utf.8")) 

«html» «head»«title* The Dormouse's story</title> 

</head><body><p class="title” ^ name-"dromouse"»«b»The | Dormouse's 
Story</b></p> 

<p class="story">Once upon a time there were three little sisters; and their 
names were 

«a href-"http://example.com/elsie" class-"sister" id-"link1"»«l.. Elsie ..></a>, 


«a href-"http://example.com/lacie" class-"sister" id="link2">Lacie</a> and 
«a href-"http://example.comttillie" class-"sister" id="link3">Tillie</a>; 
and they lived at the bottom of a well.«/p» 

<p class-"story"»...«/p» 

</body></html> 

>>> print(type(html)) 

«class 'Ixml.etree. Element 

>>> result = html.xpath(//li") 

>>> print(result) 

0 

>>> result = html.find('//a") 

>>> print(result) 

<Element a at 0x1bcf979cec8> 

>>> result = html.findall('.//a") 

>>> print(result) 


[<Element a at 0x1bcf979cec8>， «Element a at 0x1bcf979ce48>， «Elementa 


at 0x1bcf979ce88>] 
>>> result = html.xpath('//a') 
>>> print(result) 


[<Element a at 0x1bcf979cec8>， «Element a at 0x1bcf979ce88>， «Elementa 


at Ox1bcf979ce48>] 
>>> result = html.find('//a") 
Traceback (most recent call last): 
File "<pyshell#16>", line 1, in «module» 
result = html.find(//a") 
SyntaxError: cannot use absolute path on element 


本 例 以 检索 目标 文档 text 中 的 超 链接 标签 a 为 例 ， 分 别 使 用 3 种 标签 


搜索 方式 查找 。 通 过 实战 ， 我 们 不 难 发 现 : 


@find0: 返回 目标 标签 第 一 个 位 置 ， 而 且 必须 用 相对 路 径 ， 不 然 提示 


语法 错误 。 
# 返回 第 一 个 元 素 位 置 
>>> result = html.find('.//a") 
>>> print(result) 
<Element a at Ox1bcf979cec8> 
#find() 使 用 绝对 路 径 报错 
>>> result = html.find(/a") 
Traceback (most recent call last): 
File "<pyshell#16>", line 1, in <module> 
result = html.find('//a") 
SyntaxError: cannot use absolute path on element 


Ofindall): 5 xpath() 的 检索 结果 一 致 ， 只 是 findall0 中 必须 使 
路 径 ， 而 xpath() 两 种 路 径 格式 均 可 。 
#find all) 函数 


zn 


相对 
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>>> result = html.findall('.//a") 

>>> print(result) 

[«Element a at Ox1bcf979cec8», «Element a at Ox1bcf979ce48», «Elementa 

at 0x1bcf979ce88>] 

#xpath 绝对 路 径 检索 

>>> result = html.xpath('//a") 

>>> print(result) 

[<Element a at 0x1bcf979cec8>， <Element a at 0x1bcf979ce88>， «Elementa 

at Ox1bcf979ce48>] 

#xpath 相对 路 径 检索 

>>> result = html.xpath( //a") 

>>> print(result) 

[«Element a at Ox1bcf979cec8», «Element a at Ox1bcf979ce48», «Elementa 

at Ox1bcf979ce88»] 

>>> 

【提示 】 

何 为 XPath 语法 ? 

XPath 是 一 门 在 XML 文档 中 查找 信息 的 语言 XPath 可 用 来 在 XML 
文档 中 对 元 素 和 属性 进行 遍历 。XPath 是 W3C XSLT 标准 的 主要 元 素 , 并 
H. XQuery 和 XPointer 都 构建 于 XPath 表达 之 上 。 因 此 ， 对 XPath 的 理 
解 是 很 多 高 级 XML 应 用 的 基础 。 在 XPath 中 , 有 7 种 类 型 的 节点 : 元 素 、 
属性 、 文 本 、 命 名 空间 、 处 理 指令 、 注 释 以 及 文档 ( 根 ) 节点 。XML 文档 
是 被 作为 节点 树 来 对 待 的 ， 树 的 根 被 称 为 文档 节点 或 者 根 节 点 。 

关于 XPath 语法 的 具体 内 容 ， 感 兴趣 的 读者 可 自行 学 习 ， 鉴 于 篇 幅 的 
关系 ， 这 里 不 再 详细 描述 ， 大 家 知道 Lxml 标签 搜索 方法 参数 的 固定 格式 
即 可 。 


11.3 RPAH: 酷 狗 TOP500 Hae 


通过 对 疏 虫 基础 知识 及 Python 息 虫 程序 设计 中 所 涉及 的 三 大 库 的 学 
习 ， 本 节 以 获取 酷 狗 网 站 “TOP500 歌曲 排行 榜 ” 数 据 为 例 ， 实 战 练习 基于 
Python 的 简单 候 虫 程序 设计 思路 及 实现 过 程 。 


11.3.1 思路 简 析 


1. 任务 要 求 

以 酷 狗 网 站 “TOP500 歌曲 排行 榜 ” 网 页 为 定向 爬 取 对 象 ， 通 过 疏 虫 程 
序 获 取 页 面 中 排名 前 500 的 歌曲 的 rank. singer. titles 和 times 字段 值 ， 并 
输出 结果 。 


2. 环境 要 求 
确保 已 经 正确 安装 Python 安装 包 、Requests 模块 、BeautifulSoup 模块 
和 Lxml 模块 。 


11.3.2 ”代码 实现 


代码 如 下 : 


import requests 
from bs4 import BeautifulSoup 
import time 
headers ={ 
'User.Agent': 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 
(KHTML, like Gecko) Chrome/56.0.2924.87 Safari/537.36' 
) 
def get info(url): 
wb. data = requests.get(url, headers-headers) 
soup = BeautifulSoup(wb data.text, "'Ixml') 
ranks = soup.select('span.pc temp num') 
titles = soup.select('div.pc temp songlist > ul > li > a") 
times = soup.select('span.pc temp tips r > span") 
for rank, title, time in zip(ranks, titles, times): 
str1 = title.get text().split(.") 
data = ( 
'rank': rank.get text().strip(), 
'singer': str1[0], 
'song* str1[-1], 
"time": time.get text().strip() 
) 
print(data) 
if name --' main ' 
urls 7 [ 
"http://www.kugou.com/yy/rank/home/(.8888.html' format(str(i)) for i in 
range(1, 30) 
] 
for url in urls: 
get info(url) 
time.sleep(2) 


11.3.3 ”代码 分 析 


结合 代码 实现 过 程 ， 分 析 如 下 。 
(1) 导入 Requests 模块 、BeautifulSoup 模块 和 Time 模块 。 
import requests 


from bs4 import BeautifulSoup 
import time 
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(2) 定义 文件 头 ， 模 拟 浏览 器 访问 ， 防 止 网 站 屏蔽 。 


headers ={ 
'User.Agent': 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 
(KHTML, like Gecko) Chrome/56.0.2924.87 Safari/537.36" 


H 
(3) 定义 get_info0 函 数 ， 获 取 TOP500 信息 。 


def get. info(url): 
wb data = requests.get(url, headers-headers) 
soup = BeautifulSoup(wb data.text, "'Ixml') 
ranks = soup.select('span.pc temp num') 
titles = soup.select('div.pc temp songlist > ul > li > a") 
times = soup.select('span.pc temp tips r > span') 

【提示 】 

@BeautifulSoup 的 select() 函数 的 使 用 方法 : 如 上 在 get_info0 函 数 中 
使 用 soup.selectO0 时 ， 括 号 中 的 参数 是 ' 标 签名 .类 别名 '。 如 对 于 排名 字段 
(ranks)， 括 号 里 就 应 该 是 'span.pc_temp_num'。 另 外 ， 当 一 个 字段 网 套 多 个 
标签 时 ， 不 能 只 写 离 字段 值 最 近 的 标签 ， 应 当 从 外 到 内 ， 按 序 依 次 排列 ， 
标签 间 用 “>” 符 号 隔 开 。 如 上 get_info() 函 数 中 的 歌 名 字段 〈titles)。 

@ 如 何 获取 字段 的 标签 属性 呢 ? 通常 ， 在 网 页 中 选中 字段 ， 然 后 单 击 
鼠标 右键 ， 在 弹出 的 快捷 菜单 中 选择 “审查 元 素 ” 即 可 。 

(4) 定义 实现 get_info0 函 数 ， 用 于 获取 标签 中 的 指定 数据 。 

for rank, title, time in zip(ranks， titles, times): 
str1 = title.get_text().split('.') 
data ={ 
rank' rank.get text().strip(), 
'singer': str1[0], 
'song* str1[-1], 
"time": time.get text().strip() 
) 


(5) 定义 条 件 _main 函数 ， 用 于 获取 排行 榜 数 据 地 址 。 


if name --' main * 
uris = [ 
'http;//www.kugou.com/yy/rank/home/[).8888.html' format(str(i)) for i in 
range(1, 24) 
] 


(6) 定义 for 循环 遍历 urls。 


for url in urls: 
get info(url) 
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CD. 代码 行 调用 time 模块 睡眠 函数 。 
time.sleep(2) 
程序 运行 结果 如 图 11.8 所 示 。 


Run pc 
p] 个 {rank : 493， singer: EÈ o song : ”行者 time 3:07} 
{rank :“494 'singer': "dE ', "song: RBR. time 2:37) 
m Üxank': 495, "singer: "AGERE '. "song | ”单身 情歌 ' time’: 4:37] 
WE | Ej (rank 5496 ，' singer ;“ 夏 天 播放 “， song :小 宝贝 times 53:12) 
mp | 了 Czak: 497. singer: “高 进 、 小 沈阳 “，' song : ”我 的 好 兄弟 time’: “4:37'} 
ipm { rank’: '498', ' singer: "XE ', "song: EE, time: 4:04) 
ri SO (uas aov, 'singer': AAEE ', "song : RANAR, ' time’: 7341) 
x m ona. ' singer: EA SQUE ^. "song : ”0I 歌 time 72:18) 
a Process finished with exit code 0 


11.8 TOP500 演示 程序 运行 结果 


如 图 11.8 所 示 ， 怜 虫 程序 已 成 功 获取 TOP500 的 相关 数据 。 至 此 ， 如 
何 使 用 三 大 库 创 建 疏 虫 程序 已 演练 完毕 ， 接 下 来 ， 将 学 习 如 何 使 用 Scrapy 
框架 设计 怜 虫 程序 。 


11.4 Scrapy 框 架 


Scrapy 是 一 个 非常 优秀 的 框架 ， 操 作 简 单 ， 拓 展 方便 ， 是 比较 流行 的 
息 虫 解决 方案 。 本 节 将 学 习 Scrapy 框架 的 基本 知识 和 安装 使 用 方法 。 


11.4.1. Scrapy Ieri 


Scrapy 是 一 个 用 Python SHERHE, RI, EHAE. Scrapy 
使 用 Twisted 异步 网 络 库 来 处 理 网 络 通信 ， 架 构 清晰 ， 其 包含 的 各 种 中 间 件 
可 以 良好 地 完成 各 种 需求 。 框 架 如 图 11.9 所 示 ， 其 相关 组 件 功能 如 下 。 

引擎 (Scrapy Engine): 负责 控制 在 系统 中 所 有 组 件 间 的 传递 ， 并 在 
相应 动作 发 生 时 触发 对 应 事件 。 

OREA (Scheduler): 负责 接受 引擎 发 送 过 来 的 Requests 请 求 ， 并 按 
照 一 定 的 方式 进行 整理 排列 、 入 队 ， 并 等 待 Scrapy Engine 来 请 求 时 ， 交 给 
引擎 。 

@ 下 载 器 (Downloader): 负责 下 载 Scrapy Engine 发 送 的 所 有 Requests 
请 求 , 并 将 其 获取 到 的 Responses 交还 给 Scrapy Engine, 由 引擎 交 给 Spiders 
来 处 理 。 

@Spiders: 负责 处 理 所 有 Responses， 从 中 分 析 提 取 数 据 ， 获取 Item 字 
段 需要 的 数据 ， 并 将 需要 跟 进 的 URL 提交 给 引擎 ， 再 次 进入 Scheduler。 

Oltem Pipeline: 负责 处 理 Spiders 中 获取 的 Iem， 并 进行 处 理 ， 如 去 


重 、 持 久 化 存储 。 

O FHE (Downloader Middlewares): 是 引擎 与 下 载 器 之 间 的 特 
定 钩子 。 用 于 处 理 Downloader 传递 给 引擎 的 Response。 通 过 插入 自 定 义 代 
码 来 扩展 Scrapy 的 功能 。 

Spider 中 间 件 (Spider Middlewares): 是 引擎 与 Spider 之 间 的 特定 钧 
子 。 用 于 处 理 Spider 的 输入 和 输出 。 通 过 插入 自 定 义 代 码 来 扩展 Scrapy 的 


功能 。 
Scheduler 人 一 >? 
Internet. 
Item Scrapy 
Pipeline Engine Downloader 
8 Spider 
Middlewares. 
Æ 11.9 Scrapy 框架 
【提示 】 


图 11.9 中 的 Scrapy 框架 图 来 源 于 Scrapy 帮助 文档 。 
OScrapy 的 文档 地 址 为 https://doc.scrapy.org/en/latest/, 包括 各 种 版 本 的 
Scrapy 帮助 文档 。 


11.4.2. Scrapy 的 安装 


Scrapy 作为 Python 爬虫 开发 的 流行 框架 ， 精 巧 易 用 。 其 安装 方式 和 
Python 第 三 方 库 类 似 ， 也 有 两 种 方式 ， 具 体 介 绍 如 下 。 

(1) 通过 pip install scrapy 方式 安装 。 

按 Win+R 快捷 键 打开 “运行 ”对 话 框 ， 输 入 cmd， 打 开 “ 命 令 提 示 符 
窗口 ?， 输 入 pip install scrapy， 如 图 11.10 所 示 。 


2: NI. ni rator pip install scrapy 


Collecting scrap 
hed htt 
96580 


D 


11.40 Scrapy 安装 界面 


正常 情况 下 , 安装 出 错 ,是 由 于 Windows7 系 统 没 有 安装 Microsoft Visual 


C++ Build Tools， 如 图 11.11 所 示 。 


error: Mic F sual C++ 14.0 i it with "Microsoft Visual 
C++ Build Tool landinghub. ^visual-cpp-build-tools 


11.11 Scrapy 安装 报错 提示 图 
"FAX visualcppbuildtools_full.exe 运行 安装 Visual C++ Build Tools 后 ,在 
“命令 提示 符 ” 窗 口中 输入 pip install scrapy 并 按 Enter 键 ， 安 装 成 功 ， 如 图 
11.12 所 示 。 


alling collecte 
inning setup.py in 


Successfully installed Twisted-18.4.0 scrapy-1.5.0 


ers idministrator» 
11.12. Scrapy 安装 成 功 提示 界面 
(2) 直接 在 Scrapy 官网 https: aid FX Scrapy 安装 包 ， 解 压缩 ， 


在 “命令 Lm» 


命令 提示 符 ” 窗 口 运行 setup.py 并 安装 ， 操 作 步 骤 如 图 11.13 所 示 。 


GOScrapy TEE 


Æ 11.13 Scrapy 主页 
单 击 Download 菜单 进入 下 载 界面 , 单 击 右 侧 Zip 按钮 进行 下 载 ， 如 
图 11.14 所 示 。 


Get Scrapy 


Install the latest version of Scrapy 
& Scrapy 1.5 


$ pip install scrapy 


[7] 
Eco 二 Ca R Q ume 
图 11.14. Scrapy 下 载 界面 


11.4.3 Scrapy 的 使 用 


安装 完毕 Scrapy 框架 ， 便 可 以 通过 它 快速 搭建 候 虫 程序 开发 架构 ， 具 
体操 作 如 下 。 

在 Windows7“ 命 令 提示 符 ” 窗 口 ， 通 过 scrapy startproject ScrapyTest 
命令 创建 ScrapyTest 爬虫 项 目 ， 如 图 11.15 所 示 。 


D: pythonycd code 


rapyTest 
ectory ’d:\\python\\lib\\site 


apy genspider example example.com 


D: spython code? 


11.15 ”命令 方式 创建 Scrapy Ii El 
这 里 将 创建 Scrapy 项 目的 位 置 存放 于 pycharm 的 项 目 代码 工作 空间 ， 
这 样 就 可 以 借助 IDE 呈现 Scrapy 息 虫 项 目的 组 织 结构 ， 如 图 11.16 所 示 。 
BD Project M Q 33-0 
code 
ScrapyTest 
ScrapyTest 
spiders 
W init .py 
W init .py 
W items.py 
W middlewares.py 
W pipelines.py 
W settings.py 
scrapy.cfg 


图 11.16 Scrapy 项 目 结构 
从 图 11.16 项 目的 目录 结构 ， 我 们 不 难 发 现 ， 基 于 Scrapy 框架 的 爬虫 
项 目 结构 组 织 如 下 。 
Q  ScrapyTest/: 该 项 目的 python 模块 名 称 , 之 后 将 在 此 加 入 代码 。 
Q  ScrapyTest/spiders/: 放置 spider 代码 的 目录 ， 用 于 编写 用 户 
XE XLI RE nh o 
OQ ScrapyTest/tems.py: 项 目 中 的 item 文件 ， 用 于 定义 用 户 要 抓 
取 的 字段 。 


O ScrapyTest/middlewares.py 中 间 件 : 主要 是 对 功能 的 拓展 ， 用 
于 用 户 添 加 一 些 自 定 义 的 功能 ， 如 添加 随机 useragent， 添 加 
proxy。 

Q ScrapyTest/pipelines.py: 项 目 中 的 pipelines 文件 。 管 道 文件 ， 
当 spider 抓 取 到 内 容 Citem). 以 后 ， 会 被 送 到 这 里 ， 这 些 信 息 

(tem) 在 这 里 会 被 清洗 ， 去 重 ， 保 存 到 文件 或 者 数据 库 。 
Q  ScrapyTest/settings.py: 项 目的 设置 文件 , 用 来 设置 怜 虫 的 默认 
信息 ， 及 相关 功能 的 开启 与 否 ， 如 是 否 遵守 robots 协议 ， 设 置 
默认 的 header 等 。 
口 scrapy.cfg: 项 目的 配置 文件 。 
在 了 解 Scrapy 框架 的 基础 之 上 ， 我 们 自己 动手 编写 第 一 个 Spider 来 了 
fif Scrapy 的 基本 使 用 方法 。 

F riri 388 3: E39 5 EI] book 排行 榜 数 据 来 演示 如 何 使 用 Scrapy 框架 开发 
Te PUT. 

(1) 首先 ， 在 代码 根 目 录 通 过 Scrapy startproject doubanbook 创建 名 字 
为 doubanbook 的 爬虫 项 目 ， 如 图 11.17 所 示 。 


图 11.17 命令 方式 创建 Scrapy ERMA 
(2) 使 用 Pycharm IDE 打开 刚才 创建 的 doubanbook 项 目 ， 其 框架 
如 图 11.18 所 示 。 


doubanbook 

doubanbook 
spiders 

BÀ int py 
启 items.py 
È middlewares.py 
内 pipelines.py 
© settings.py 
bookinfo.csv 
scrapy.cfg 
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Æ 11.18 Pycharm 下 的 doubanbook 项 目 框架 


(3) 在 Pycharm 下 ， 双 击 右 侧 的 items.py 文件 ， 在 此 处 定义 将 要 抓 取 
的 book 字段 名 称 。 在 自动 生成 的 class 类 中 添加 对 应 字段 , 如 图 11.19 所 示 。 
[È items.py x | 


# —*- coding: utí-8 —*- 


7 Define here the models for your scraped items 


7 See documentati 


6 * https: //doc. sczapy. ozg/en/latest/topics/items. htm] 


import scrapy 


class DoubanbookItem(scrapy. Item): 


12 * define the fields for your item here like 


# name 一 s 


crapy. Field 
14 name = scrapy. Field 0 
price = scrapy Field 0 
16 publisher = scrapy Field 0 
7 ratings = scrapy Field 0 
edition year = scrapy.FieldÓ 
19 author = scrapy.FieldÓ 
pass 


11.19. item.py 文件 示意 图 


(4) 在 图 11.19 中 右 击 spiders 文件 夹 ， 在 弹出 的 快捷 菜单 中 选择 New 
一 PythonFile 命令 ， 打 开 New Python File 对 话 框 ， 输 入 文件 名 bookspider， 
Hik OK 按钮 ， 如 图 11.20 Brzs, GUT d cf. 


* E doubanbook 
v doubanbook 
v © spiders 
[E init .py 
局 bookspider.py 
VÀ init py 
启 tems.py 
启 middlewares.py 
lé pipelines.py 
È settings.py 
E] bookinfo.csv 
B scrapy.cfg 


Æ 11.20 HERR 
(5) 双击 bookspiderpy XF, ITA XRAM, it EAEE 


序 ， 如 图 11.21 所 示 。 


内 bookspider.py x 


import 


from ok items import Doubanbookltem 


class BookSpider (scrapy. Spider 


.i def parsel response) 
yield scrapy Request (response url, callback=self parse pago) 
for page in response xpath( 

link * page. h f 

yield scrapy Request (link 


def parse pote 


for it x [6classu^ ite 


图 11.21 -SEREF 
(6) 双 击 打开 settings.py 息 虫 属性 配置 文件 , 输入 模拟 浏览 器 访问 代码 ， 
这 是 必需 的 ， 不 然 ， 息 虫 容易 被 拒绝 访问 并 报错 。 


USER AGENT = 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 
(KHTML, like Gecko) Chrome/55.0.2883.87 Safari/537.36' 


CD) 至 此 ， 第 一 个 爬虫 程序 设计 完毕 ， 保 存 所 有 代码 。 接 下 来 ， 运 行 
fede, bn 11.22 所 示 。 


11.22 FA book 排行 榜 爬 虫 执行 结果 
【提示 】 
OJE:RÍ] DOS 执行 命令 : 务必 要 在 爬虫 项 目下 执行 “scrapy crawl MEH 
名 ”命令 ， 如 图 11.23 所 示 。 


Æ 11.23 执行 scrapy crawl 爬虫 命令 
@ 用 XPath 定位 时 ， 一 定 要 明确 爬 取 字 段 所 限定 标签 的 位 置 关 系 。 建 
议 通 过 查看 源 代 码 ， 找 到 要 疏 取 数据 的 通用 模板 。 我 们 通过 反 查 源 代 码 寻 
找 显示 模板 。 以 《 追 风筝 的 人 》 为 例 ， 如 图 11.24 所 示 。 
TREH Top 250 


2006-5 / 29.0075 


t / 2003-8 / 22.0077 


图 11.24 ZH TOP 250 截图 
通过 分 析 ， 我 们 发 现 每 一 个 <table> 标 签 正好 确定 一 个 完整 的 数据 item 
《 追 风 筝 的 人 》 源 代码 如 下 所 示 。 


«span style-"font.size:12px;"» The Kite Runner</span> 
</div> 
<p class="pl">[ 美 ] 卡 勒 德 ` 胡 赛 尼 / FER | 上 海 人 民 出 版 社 / 
2006.5 / 29.00 元 </p> 
<div class-"star clearfix" 
«span class-"allstar45"» «/span- 
«span class-"rating nums"*8.«table width="100%"> 
«tr class-"item"- 
«td width-"100" valign="top"> 
«a class-"nbg" href-"https://book.douban.com/subject/1770782/" 
onclick-"moreurl(this, {i:'0})"> 
«img 


src-"https://img3.doubanio.com/view/subject/m/public/s1727290.jpg" width-"90" 
I 
«la» 
«ftd» 
<td valign="top"> 
<div class-"pl2"» 
<a href="https://book.douban.com/subject/1770782/" 
onclick=&#34;moreurl(this，{i:&#39;0&#39;})&#34; title=" 追 风筝 的 人 "> 
追 风筝 的 人 </a> &nbsp; 
«img src="https://img3.doubanio.com/pics/read.gif" alt=" 可 试 读 " title=" 可 试 读 "/> 
<br/> 
9</span> 
«span class="pl">( 
316371 人 评价 
)</span> 
</div> 
<p class-"quote" style="margin: 10px 0; color: #666"> 
«span class="inq"> 为 你 ， 千 千 万 万 遍 </span> 
</p> 
</td> 
</tr> 
</table> 


而 且 <tr> 标 签 的 class='item "正好 闭 包 所 有 有 怜 取 的 数据 项 。 这 里 ， 我 们 
就 可 以 以 它 为 基准 点 定位 所 有 数据 项 字段 值 。 
@XPath 定位 语法 常用 标示 一 定 要 熟 记 于 心 。 


115 实验 


1. 实验 目的 

O 3€ i Python [E R= KJE Requests, Beautiful Soup 和 LXMI 的 基本 用 
法 ， 能 够 熟练 安装 相关 的 库 ， 并 能 使 用 三 大 库 完 成 简单 的 爬虫 程序 的 设计 
与 实现 。 

@ 理 解 Scrapy 息 虫 框架 的 基本 原理 ， 掌 握 Scrapy 疏 虫 框架 的 安装 方法 。 

日 熟练 掌握 scrapy startproject 命令 创建 候 虫 框架 的 方法 ， 以 及 借助 第 
三 方 IDE Pycharm 进行 基于 Scrapy 框架 的 疏 虫 程序 的 设计 实现 。 

2. 实验 内 容 

实验 一 “Python 疏 虫 三 大 库 的 安装 使 用 

© 使 用 pip install 命令 安装 Requests. BeautifulSoup 和 LXMI 三 大 库 。 

注意 : pip 不 是 Python 的 内 部 命令 ， 且 不 可 在 Python 命令 窗口 使 用 ， 
应 当 在 DOS 环境 下 直接 使 用 。 
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O f£ Python 3.6.5 Shell | Fl ZKE fi 5 fj 5 E rb Fe]. 
以 “ 酷 狗 TOPS00" ERREF IPER, Bi ERER “EAFA” HE 
名 前 100 的 数据 。 
实验 二 ”Scrapy 怜 虫 框架 的 安装 方法 
@ 使 用 pip install. 安装 Scrapy ME HHEH. 
@ 登 录 Scrapy 官网 https://scrapy.org/ 下 载 Scrapy 安装 包 ， 解 压缩 ， 在 
“命令 提示 符 ” 窗 口 运行 setuppy， 安 装 Scrapy MERHER. 
实验 三 ”Scrapy 息 虫 程序 框架 的 创建 及 程序 开发 
@ 通 过 scrapy startproject 命令 创建 名 为 ScrapyTest 的 基于 Scrapy 框架 
的 爬虫 项 目 ， 如 图 11.25 所 示 。 
E Projet | O Riga 
v © code DApythoncode 
* © ScrapyTest 
v © ScrapyTest 
v [spiders 
i init .py 
应 init_.py 


局 items.py 
[© middlewares.py 
[© pipelines.py 
启 settings.py 
E scrapy.cfg 
图 11.25 ScrapyTest JE chi Eze 


注意 : scrapy startproject 直接 在 DOS 环境 下 使 用 。 

@ 下 载 并 安装 第 三 方 IDE JetBrains PyCharm Community Edition 
2016.2.3。 

@ 用 第 三 方 IDE Pycharm 打开 建 好 的 项 目 框架 ， 如 图 11.25 所 示 ， 在 
Spiders 中 完成 豆 准 电影 排行 榜 的 爬 取 。 
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项 目 实战 : 数据 可 视 化 


Python 中 数据 可 视 化 有 多 种 方案 。 正 是 由 于 这 种 多 样 性 ， 选 用 何 种 方 
案 进 行 数据 的 可 视 化 操作 便 极 具 挑战 性 。 本 章 以 实战 项 目 需求 为 导向 ， 介 
绍 Python 中 比较 流行 的 数据 可 视 化 模块 ， 以 及 如 何 使 用 它们 创建 对 应 的 可 
视 化 图 。 下 面 重点 介绍 Pyplot 模块 、Artist 模块 以 及 Pandas 模块 。 


12.1 Matplotlib 简介 


Matplotlib 是 基于 Python 语言 的 开源 项 目 ， 旨 在 为 Python 提供 一 个 数 
据 绘 图 包 。 它 提供 了 一 整套 和 Matlab 类 似 的 命令 API， 适 合 交互 式 地 进行 
制图 。 并 且 可 以 方便 地 将 其 作为 绘图 控件 ， 嵌 入 GUI 应 用 程序 中 。 它 的 文 
档 相 当 完 备 ， 并 且 Gallery 页 (https:/matplotlib.org/galleryhtml) 中 有 上 百 
幅 缩 略 图 ， 打 开 之 后 都 有 源 程序 。 因 此 如 果 需 要 绘制 某 种 类 型 的 图 ， 只 需 
要 在 这 个 页 面 中 浏览 一 选择 图 像 一 打开 一 复制 一 粘贴 一 下 ， 基 本 上 都 能 搞 
定 。 本 节 作为 Matplotlib 的 入 门 ， 主 要 介绍 Matplotlib 绘图 的 一 些 基本 概念 
和 基本 操作 。 


12.1.1 Pyplot 模块 介绍 


俗话 说 得 好 “ 熟 读 唐诗 三 百 首 , 不 会 作 诗 也 会 吟 ” 模仿 是 最 好 的 老师 ， 
编写 程序 也 不 例外 。 这 里 ， 首 先 通过 Matplotlib 自 带 的 galleryhtml 页 面 中 
的 案例 了 解 绘图 程序 的 基本 架构 ， 然 后 ， 借 助 归纳 的 框架 为 原型 编写 程序 。 
首先 , 通过 浏览 器 访问 Matplotlib 官网 的 gallery 页 面 ， 如 图 12.1 所 示 。 
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12.1 Matplotlib 的 gallery 页 面 
如 图 12.1 所 示 ， 可 以 直观 地 看 到 Matplotlib 画廊 的 基本 布局 ， 比 较 简 
洁 ， 由 画廊 分 类 列表 和 对 应 的 分 类 中 提供 的 案例 展示 栏 构成 。 这 里 选择 
gallery 下 的 Lines,bars,and markers 分 类 中 的 line demo dash control.py 为 模 
仿 对 象 ， 来 调试 运行 程序 。 在 gallery 页 面 对 应 的 栏目 下 单 击 该 demo 的 图 
像 ， 进 入 demo 页 面 ， 如 图 12.2 所 示 。 
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12.2 gallery demo 
然后 ， 复 制 如 图 12.2 所 示 demo 中 的 代码 至 Python Shell 中 并 运行 ， 结 
果 如 图 12.3 所 示 。 
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12.3 demo 执行 示意 图 


分 析 如 上 demo 示例 代码 ， 我 们 不 难得 出 Matplotlib 绘图 程序 的 基本 结 
构 ， 包 含 以 下 6 个 部 分 : 


日 分 别 导 入 模块 matplotlib pyplot 和 NumPy。 


@ 定 义 横 轴 标 度 并 以 横 轴 标 度 为 自 变量 定义 纵 轴 功 能 函数 。 


@ 通 过 figure() 函 数 指定 图 像 的 长 宽 比 。 
@ 通 过 plot0 函 数 绘制 功能 函数 。 

@ 通 过 plt 的 属性 函数 设置 图 像 属 性 。 
@ 通 过 show0 函 数 显 示 图 像 。 


通常 ，Matplotlib 的 pyplot 子 库 提供 了 和 matlab 类 似 的 绘图 API, 方便 
用 户 快速 绘制 2D 图 表 。 
EFK, UEH demo 示例 所 总 结 出 来 的 Matplotlib 绘图 程序 基本 结构 


为 基础 ， 来 完成 一 个 正 余弦 函数 的 图 像 绘制 程序 ， 具 体 程序 代码 如 下 : 


>>> import matplotlib.pyplot as plt # 载 入 Matplotlib 的 绘图 模块 Pyplot 并 重 命名 


为 plt 

>>> import numpy as np 

>>> x = np.linspace(0,10,1000) 
>>> y = np.sin(x) 

>>> Z = np.cos(X**2) 


>>> plt.figure(figsize = (8,4)) # 指 定 图 像 的 长 宽 比 


«Figure size 800x400 with 0 Axes» 
>>> plt.plot(x,y,label-"$sin(x)$",color-"red" linewidth =2) 


[«matplotlib.lines.Line2D object at 0x00000298E1168860»] 
>>> plt.plot(x,z,label-"$cos(x^2)$",color-"blue" linewidth =1) 
[«matplotlib.lines.Line2D object at 0x00000298DF020438»] 


>>> plt.xlabel("Times(s)") 
Text(0.5,0,'Times(s)) 
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>>> plt.ylabel("Volt") 
Text(0,0.5, Volt") 

>>> plt.title("PyPlot first Example") # 子 图 标的 标题 
Text(0.5,1,'PyPlot first Example") 

>>> plt.ylim(-1.2,1.2) #Y 轴 的 显示 范围 
(51:271) 


>>> plt.legend() # 显 示 图 中 左下 角 的 提示 信息 
«maiplotlib.legend.Legend object at 0x00000298E1156208> 
>>> plt.show() 


程序 运行 结果 如 图 12.4 所 示 。 


xj - PyPlot First Example 
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124 PyPlot 正 余弦 函数 绘制 图 
这 样 , 我 们 就 使 用 Matplotlib 提供 的 绘图 方法 完成 了 正 余弦 函数 图 像 的 
绘制 。 下 面 重 点 学 习 plotO 的 使 用 方法 。 


12.1.2 ”plot() 函 数 


如 12.1.1 节 例 子 所 示 ， 在 绘制 正 余弦 函数 图 时 ， 我 们 调用 了 Matplotlib 
的 plot0 函 数 。 该 函数 主要 用 于 在 figure 绘制 对 象 中 绘制 各 种 曲线 ， 其 调用 
形式 灵活 ， 可 用 其 参数 指定 其 显示 风格 。 下 面 的 程序 代码 是 通过 调用 plot() 
函数 进行 曲线 绘图 的 。 

>>> plt.plot(X,y,label='$sin(x)$ ,color= "red ,linewidth =2) 

[«matplotlib.lines.Line2D object at 0x00000267CB790978>] 

>>> plt.plot(x,z,label="$cos(x^2)$",color="blue ,linewidth =1) 

[«matplotlib.lines.Line2D object at 0x00000267CB7E6320>] 

由 以 上 代码 可 以 看 出 ，plotO 常 用 的 参数 包括 坐标 数据 和 格式 参数 ， 标 
准 格式 是 pltplot(x.yformat string,**kwargs) . x 轴 数 据 ，y 轴 数 据 ， 
format string 控制 曲线 的 格式 ， 字 符 串 format string 由 颜色 字符 、 风 格 字符 
和 标记 字符 构成 。 现 介绍 其 格式 参数 含义 如 下 。 

O label: 用 于 给 所 绘制 的 曲线 定义 名 称 ， 此 名 字 在 图 示 中 显示 。 
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只 要 在 字符 串 前 后 添加 "$" 符 号 ，Matplotlib R f£ H H pg gem 
latex 引擎 绘制 的 数学 公式 。 

O color: 指定 曲线 的 颜色 。 常 用 的 颜色 字符 有 蓝 色 b). gE 
('g')、 红 色 ('r') 、 青 绿色 ('c') 、 洋 红色 Cm, RE Cy) 、 
黑色 CD, HË CwD 、 灰 度 值 字 串 〈"0.8') 其 取 值 范围 为 
*0-1" , RGB 颜色 值 (4008000) 。 

O linewidth: 指定 曲线 的 宽度 。 

Q b--: 指定 曲线 的 颜色 和 线 型 ， 这 个 参数 称 为 格式 化 参数 ， 它 能 
够 通过 一 些 易 记 的 符号 快速 指定 曲线 的 样式 。 常 用 的 线 型 有 点 
(.) 、 实 线 CO BAR CO 、 点 线 (: ) 、 虚 线 (--) 、 无 
AA». 


12.1.3 ”绘制 子 图 


在 Matplotlib 中 用 轴 表示 一 个 绘图 区 域 ， 一 个 绘图 对 象 figure) 可 以 
包含 多 个 轴 (axis)， 可 以 将 其 理解 为 子 图 。 上 面 绘制 正 余 弦 的 例子 中 ， 绘 
图 对 象 只 包括 一 个 轴 ， 因 此 只 显示 了 一 个 轴 。 可 以 使 用 subplot 函数 快速 给 
制 有 多 个 轴 的 图 表 ， 其 默认 的 函数 调用 格式 如 下 : 

subplot(numRows, numCols, plotNum) 

subplot 通过 numRows. numCols 两 个 参数 将 绘图 区 域 划分 为 numRows X 
numCols 个 子 区 域 , 然后 按照 从 左 到 右 、 从 上 到 下 的 顺序 对 每 个 子 区 域 进行 
编号 ， 并 且 子 图 的 编号 从 1 开始 。 下 面 通过 subplot 函数 对 正 余弦 函数 图 像 
使 用 子 图 绘制 ， 程 序 代码 如 下 : 


>>> import matplotlib.pyplot as plt 

>>> import numpy as np 

>>> x = np.linspace(0, 10, 1000) 

>>> y = np.sin(x) 

>>> Z = np.cos(x**2) 

>>> plt.figure(figsize=(8,4)) 

<Figure size 800x400 with 0 Axes> 

>>> plt.subplot(2,1,1) 

«matplotlib.axes. subplots.AxesSubplot object at 0X00000267C8CBEF98-» 
>>> plt.plot(x,y,label-'Ssin(x)$',color-"red" linewidth =2) 
[«matplotlib.lines.Line2D object at 0xX00000267CB790978»] 

>>> plt.ylabel('y volt") 

Text(0,0.5, y volt") 

>>> plt.subplot(2,1,2) 

«matplotlib.axes. subplots.AxesSubplot object at 0x00000267CB790320» 
>>> plt.plot(x,Zz,label-"$cos(x^2)$" color-"blue" linewidth —1) 
[«matplotlib.lines.Line2D object at 0x00000267CB7E6320^] 
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>>> plt.ylabel('z volt") 
Text(0,0.5,z volt") 

>>> plt.xlabel("Time(s)") 
Text(0.5,0,'Time(s)") 
>>> plt.show() 


运行 显示 效果 如 图 12.5 所 示 。 
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12.5 ERI subplot FE 
【提示 】 


OHR numRows、numCols 和 plotNum 这 3 个 数 都 小 于 10， 可 以 把 它 
们 缩写 为 一 个 整数 ， 例 如 ，subplot(323) 和 subplot(3,2,3) 是 相同 的 。 

Osubplot 在 plotNum 指定 的 区 域 创建 一 个 轴 对 象 。 如 果 新 创建 的 轴 和 
之 前 创建 的 轴 重 又 ， 之 前 的 轴 将 被 删除 。 

@ 当 绘图 对 象 中 有 多 个 轴 时 ， 可 以 通过 Figure 工具 栏 中 的 Configure 
Subplots 按钮 , 交互 式 地 调节 轴 之 间 的 间距 和 轴 与 边框 之 间 的 距离 , 如 图 12.6 
所 示 , 拖 动 参 数 滑 块 即 可 。 如果 希 望 在 程序 中 调节 , 可 以 调用 subplots adjust 
函数 ， 它 有 left, Right, Bottom, Top, Wspace, hspace 等 几 个 关键 字 参 数 ， 
这 些 参 数 的 值 都 是 0 一 1 的 小 数 ， 它 们 是 以 绘图 区 域 的 宽 高 为 1 进行 正规 化 
之 后 的 坐标 或 者 长 度 。 

' 
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12.6 Configure Subplots 对 话 框 
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12.1.4. 添加 标注 


提高 


标注 又 称 注释 ， 是 在 Matplotlib 所 绘制 的 图 像 中 , 为 了 使 用 户 方便 理解 
图 像 的 含义 而 添加 的 注释 性 文字 。 其 类 似 于 程序 编写 中 程序 员 为 了 提高 代 
码 的 可 读 性 ， 给 代码 所 添加 的 注释 性 语句 。 给 图 像 添加 标注 的 根本 目的 是 


图 像 的 可 读 性 ， 增 强 和 使 用 者 的 可 交互 性 。 


通常 ， 使 用 text0 函 数 可 将 文本 放置 在 轴 域 的 任意 位 置 ， 用 来 标注 绘图 
的 某 些 特征 。 我 们 用 annotate0 方 法 提供 辅助 函数 进行 定位 ， 使 标注 变 得 准 
确 、 方 便 。 做 标注 时 ， 文 本 位 置 及 标注 点 位 置 均 由 元 组 (x，y) 描 述 。 其 中 参 
Hox. y 表示 标注 点 的 位 置 ， 参 数 xytext 表示 文本 位 置 。 


如 下 : 


import matplotlib.pyplot as plt 

import numpy as np 

x 7 np.linspace(0, 10, 1000) 

y = np.sin(x) 

z-np.cos(x**2) 

fig = plt.figure(figsize-(8, 4)) 

ax = fig.add subplot(211) 

pit.subplot(2, 1, 1) 

plt.plot(x, y, labelz'$sin(x)$', color="red", linewidth-2) 

plt.ylabel('y volt") 

pit.subplot(2, 1, 2) 

plt.plot(x, z, label-"$cos(x^2)$", color="blue", linewidthz1) 

plt.ylabel(z volt") 

plt.xlabel("*Time(s)") 

ax.annotate('sin(x)', xy7(2, 1), xytext-(3, 1.5), 
arrowprops-dict(facecolor-'black', shrink-0.05), 
) 

ax.set ylim(.2, 2) 

plt.show() 


运行 结果 如 图 12.7 所 示 。 


下 面 通过 annotate(O) 函 数 来 对 图 12.6 的 正弦 函数 进行 标注 ， 实 现 过 程 


sin() 
1 A 
$ o 
> 
a 
-2 
0 2 4 6 8 10 
1o 
o5 
S oo 
-os 
-1.0 
0 2 4 6 8 10 


Time(s) 


12.7 ”标注 正弦 函数 sin(x) 
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12.1.5 Pylab 模块 应 用 


Matplotlib 还 提供 了 一 个 名 为 Pylab 的 模块 , 它 是 一 款 由 Python 提供 的 
可 以 绘制 二 维 、 三 维 数据 的 工具 模块 ， 可 以 生成 malab 绘图 库 的 图 像 。 另 
外 ， 它 包括 了 许多 NumPy 和 Pyplot 模块 中 常用 的 函数 ， 方便 用 户 快速 地 进 
行 计算 和 绘图 ， 十 分 适合 在 Python Shell 交互 式 环境 中 使 用 。 本 节 简 单 介绍 
一 下 Pylab 模块 的 使 用 方法 。 

1. Pylab 模块 的 安装 


通常 ， 在 安装 Matplotlib 时 ， 该 模块 已 默认 完成 安装 。 因 而 无 需 单独 进 
行 安装 操作 。 
2. Pylab 基本 操作 


这 里 使 用 Pylab 提供 的 方法 来 绘制 正弦 函数 ， 通 过 简单 的 例子 来 介绍 
该 模块 的 使 用 ， 程 序 代码 如 下 : 


import pylab 
import math 
x values - [] 
| values = [] 
num = 0.0 
while num « math.pi * 4: 
y. values.append(math.sin(num)) 
x values.append(num) 
num += 0.1 
3t now plot 
pylab.plot(x values, y values, 'ro') 
pylab.show() 


代码 运行 结果 如 图 12.8 所 示 。 


12.8 Pylab 绘制 正弦 函数 图 像 

由 图 12.8 可 知 ，Pylab 所 绘制 的 正弦 函数 图 像 是 由 一 系列 的 离散 点 构 

成 。 其 绘制 点 位 置 的 计算 是 通过 math 库 对 应 的 sin0 函 数 来 完成 。 最 终 图 像 
的 生成 是 通过 Pylab 的 plot0 函 数 完成 的 。 


pylab.plot(x values, y values, 'ro') 

该 plot0 函 数 的 3 个 参数 分 别 代 表 x 坐标 值 、y 坐标 值 ， 以 及 绘制 点 所 
使 用 的 样式 ， 这 里 ro' 代 表 红 色 ， 用 o 字符 标记 位 置 点 。 关 于 Pylab 的 详细 
使 用 ， 读 者 可 参考 对 应 的 帮助 文档 。 


12.2 Artist 模块 介绍 


Matplotlib 绘图 库 的 API 包含 3 个 图 层 ， 分 别 为 backend bases.Figure 
Canvas (画板 )、 i) 和 artist.Artist (如 何 泻 染 ) 
相 比 前 两 个 API 而 言 ，Artist 用 于 处 理 所 有 的 高 层 结构 ， 如 处 理 图 表 、 文 字 
和 曲线 等 的 绘制 和 布局 。 通常 我 们 只 和 Artist 打交道 , 而 不 需要 关心 底层 的 
绘制 细节 


12.2.1 Artist 模块 概述 


Artists 分 为 简单 类 型 和 容器 类 型 两 种 。 简单 类 型 的 Artists 为 标准 的 绘 
图 元 件 ， 如 Line2D. Rectangle. Text, AxesImage 等 。 而 容器 类 型 则 可 以 
包含 许多 简单 类 型 的 Artists， 使 它们 组 织 成 一 个 整体 ， 例 如 Axis、Axes、 
Figure 等 。 
通常 ， 使 用 Artists 创建 图 表 的 标准 流程 包括 以 下 3 个 步骤 ， 
) 创建 Figure 对 象 。 
(2) 用 Figure 对 象 创建 一 个 或 者 多 个 Axes 或 者 Subplot 对 象 。 
(3) 调用 Axies 等 对 象 的 方法 创建 各 种 简单 类 型 的 Artists. 
和 其 他 第 三 方 Python 库 一 样 ，Artist 库 的 安装 也 有 两 种 方法 , 这 里 使 用 
pip install 命令 方式 进行 安装 ， 如 图 12.9 所 示 。 

画 


图 12.9 Artist 库 安 装 图 


下 面 通过 一 个 简单 的 例子 , 对 Artist 库 的 使 用 进行 简单 介绍 , 在 该 示例 
中 , 依据 Artists 创建 图 表 的 标准 流程 三 步 走 完成 正弦 函数 sin(x) 的 绘制 。 注 
意 在 使 用 Figure 对 象 创建 subplot 对 象 时 ， 若 只 有 一 个 子 图 ， 则 其 参数 为 
(LL). 


import matplotlib.pyplot as plt 

fig = plt.figure() 

ax = fig.add subplot(1,1,1) # 通过 fig 对 象 创建 子 图 
import numpy as np 

x= np.arange(0.0, 1.0, 0.01) 

y = np.sin(2*np.pi*x) 

line, = ax.plot(x, y, color-'blue', Ilw=2) 

ax.lines[0] 

plt.show() 


运行 结果 如 图 12.10 所 示 。 
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图 12.10 Artist 对 象 绘图 
12.2.2 Artist 的 属性 


Matplotlib 所 绘制 的 图 表 中 的 每 一 个 元 素 都 由 Artist 控制 , 而 每 个 Artist 
对 象 都 有 很 多 属性 控制 其 显示 效果 。 例 如 ，figure 对 象 包含 了 Rectangle 实 
例 ， 它 可 以 设置 背景 颜色 和 透明 度 ，Axes 同样 如 此 。 这 些 实例 被 储存 在 
Figure. patch. 和 Axes.patch 中 ， 其 常用 属性 详 见 表 12.1。 


表 12.1 Artist 属性 


R 性 含 义 
alpha 透明 度 ， 值 在 0~1，0 为 完全 透明 ，1 为 完全 不 透明 
animated 布尔 值 ， 在 绘制 动画 效果 时 使 用 
axes 此 Artist 对 象 所 在 的 Axes 对 象 ， 可 能 为 None 
figure 所 在 的 Figure 对 象 ， 可 能 为 None 
label 文本 标签 
. picker 控制 Artist 对 象 选取 
zorder 控制 绘图 顺序 


Artist 对 象 的 所 有 属性 都 通过 相应 的 get * 和 set * 函数 进行 读 写 , 例 
如 下 面 的 语句 将 alpha 属性 设置 为 当前 值 的 一 半 : 
fig.set_alpha(0.5*fig.get_alpha()) 
如 果 想 用 一 条 语句 设置 多 个 属性 ， 可 以 使 用 setO 函 数 : 
fig.set(alpha=0.5, zorder-2,lable-'$sin(x)$") 
关于 Artist 对 象 的 其 他 详细 情况 , 学 有 余力 的 读者 可 参考 对 应 的 帮助 文 
档 进行 深入 学 习 。 


12.3 Pandas 绘图 


Pandas 是 Python 下 最 强大 的 数据 分 析 和 探 ， 它 包含 高 级 的 数据 
结构 和 精巧 的 工具 ， 使 其 在 Python 中 处 理 数 据 更 简单 快捷 。Pandas 构建 在 
NumPy 之 上 ， 使 得 以 NumPy 为 中 心 的 应 用 更 便捷 。Pandas 功能 强大 ， 支 
持 类 似 于 SQL 的 数据 操作 ， 并 且 带 有 丰富 的 数据 处 理 函数 。Pandas 统计 作 
图 函数 依赖 于 Matplotlib， 因 而 ， 通 常 与 Matplotlib 函数 一 起 使 用 。 本 节 将 
对 Pandas 库 的 安装 和 其 统计 作 图 函数 进行 简单 介绍 。 

1. Pandas 库 的 安装 

Pandas 库 的 安装 同 其 他 的 Python 第 三 方 库 一 样 有 两 种 方式 , 这 里 使 用 


pip install 命令 方式 进行 安装 ， 格 式 如 下 : 


pip install pandas 


其 安装 结果 示意 图 如 图 12.11 所 示 。 
画 


出 


图 12.11 Pandas 库 安装 


2. Pandas 基本 操作 

为 了 能 够 熟练 地 掌握 Pandas 的 使 用 , 在 学 习 如 何 使 用 Pandas 绘图 之 前 ， 
大 家 首先 需要 了 解 其 自 带 的 两 个 重要 的 数据 结构 : 数据 框 (DateFrame) 和 
系列 〈Series)。 使 用 这 种 数据 结构 ， 便 可 很 容易 地 在 计算 机 内 存 中 构建 虚 
拟 的 数据 库 。 

@ 数 据 框 : 和 关系 数据 库 中 的 二 维 表 类 似 ， 由 行 和 列 构成 。 通 常 ， 行 
和 列 都 有 各 自 的 索引 。 使 用 索引 ， 便 可 以 快速 地 定位 到 要 访问 的 数据 框 中 
的 数据 ( 行 ， 列 )。 在 数据 框 中 ， 面 向 行 的 操作 和 面向 列 的 操作 是 对 称 的 。 
创建 数据 框 的 方式 很 多 ,我们 常用 包含 相等 长 度 的 列表 的 字典 或 NumpPy 数 
组 来 创建 数据 框 。 以 列表 字典 为 例 ， 创 建 数据 框 示例 如 下 : 


>>> import pandas as pd 

>>> data = 《Name':[ 张 三 " 李 四 ", 王 五 " 赵 六 " 郭 七 ],Age':[20,19,23,18,19], 
'Score':[89,72,65,77,80]} 

>>> df = pd.DataFrame(data) 


>>> print(df) 
Name Age Score 

DS 89 

1 earl 19 72 
2E E23 65 
3 赵 六 18 7T 
4 E 19 80 
>>> 


如 上 代码 所 示 ， 生 成 一 张 考 生成 绩 二 维 表 。 行 索引 默认 由 0 开始 ， 列 
索引 由 用 户 自 定 义 ， 即 对 应 字段 名 称 。 另 外 ， 也 可 以 显 性 地 对 行 索 引进 行 
自 定义 ， 在 上 面 代码 的 基础 之 上 添加 如 下 语句 : 

>>> df1 = pd.DataFrame(data,columns=['Name",'Age','Score'],index=['one",'two',' 

three'vfour, five]) 

>>> print(df1) 

Name Age Score 

One = 20 89 

two 李 四 19 72 

three CR 23 65 

four BUS 18 7T 

five 3E 19 80 


即 可 完成 索引 的 自 定义 工作 。 

@ 系 列 : 通常 是 对 具有 同一 属性 的 值 的 统称 。 可 以 将 其 理解 为 一 个 一 
维 数组 ， 也 就 是 退化 了 的 数据 框 。 默 认 情 况 下 ， 系 列 的 索引 是 自 增 非 负 整 
数 数列 。 如 上 示例 ， 可 以 通过 系列 获取 具有 同一 属性 的 某 一 列 记录 ， 如 姓 
名 Name， 示 例如 下 : 


>>> print(df1['Name']) 
one e 


23 一 6 


*e— 224 Python 语言 一 * 


two 李 四 
three 王 五 
four 7 
five 郭 七 


Name: Name, dtype: object 
>>> 


另外 ， 数 据 框 可 以 看 作 是 字典 类 型 ， 其 对 数据 本 身 的 增 、 删 、 改 、 查 
与 Python 中 字典 的 操作 类 似 ， 这 里 不 再 袭 述 。 

接 下 来 ， 了 解 一 下 如 何 使 用 Pandas 库 中 的 函数 绘制 图 表 ，Pandas 常 
用 的 绘图 函数 如 表 12.2 所 示 。 


表 12.2 Pandas 绘图 函数 


绘制 线性 二 维 图 
绘制 饼 形 图 


这 里 ， 用 饼 图 来 统计 学 生成 绩 等 级 占 比 ， 代 码 如 下 : 


import numpy as np 

import pandas as pd 

import matplotlib.pyplot as plt 

lable = ['A', 'B', 'C', 'D'] 

percent = [25, 51, 19, 5] 

explode - [0, 0.2, 0, 0] 

plt.axes(aspectz1) 

plt.pie(x-percent, labels-lable, autopct-'96.2f9696', 
explode-explode, shadow-True) 

plt.show() 


运行 结果 如 图 12.12 所 示 。 


c 


12.12 学生 成绩 等 级 占 比 饼 图 


【提示 】 

数据 可 视 化 中 ， 主 要 用 Pandas 作为 数据 的 分 析 的 工具 。 因 而 通常 以 
Matplotlib 为 基础 ， 将 Matplotlib 和 Pandas 结合 在 一 起 使 用 。 这 是 由 于 
Matplotlib 是 基础 图 库 ，Pandas 依赖 于 它 ， 而 且 ，Pandas 作 图 简单 快捷 、 操 
作 方 便 。 一 句 话 ， 二 者 有 效 结合 ， 能 够 大 大 地 提高 作 图 效率 。 


112.4 RHA: 词 云图 


“ 词 云 ” 是 由 美国 西北 大 学 新 闻 学 副教授 、 新 媒体 专业 主任 里 奇 。 戈 登 
(Rich Gordon) 提出 的 。 戈 登 做 过 编辑 、 记 者 ， 曾 担任 迈阿密 先驱 报 (Miami 
Herald) 新 媒体 版 的 主任 。 他 一 直 很 关注 网 络 内 容 发 布 的 最 新 形式 ， 即 那些 
只 有 互联 网 可 以 采用 而 报纸 、 广 播 、 电 视 等 其 他 媒体 都 望尘莫及 的 传播 方 
式 。 通 常 ， 这 些 最 新 的 、 最 适合 网 络 的 传播 方式 ， 也 是 最 好 的 传播 方式 。 

词 云图 是 数据 分 析 中 比较 常见 的 一 种 可 视 化 手段 。 词 云图 又 称 文字 云 ， 
是 对 文本 数据 中 出 现 频率 较 高 的 关键 词 用 图 像 的 方式 以 视觉 上 的 突出 展 
示 ， 形 成 “关键 词 的 泻 染 ”。 将 文字 制作 成 类 似 “ 云 ”一 样 的 彩色 图 片 ， 从 
而 过 滤 掉 大 量 的 文本 信息 ， 使 人 一 眼 就 可 以 领略 文本 数据 的 主要 表达 意思 。 
为 了 更 好 且 直 观 形象 地 理解 词 去 图， 我们 先 来 感受 一 下 百度 中 常见 的 文字 
云 ， 如 图 12.13 所 示 为 由 若干 关键 字 所 呈现 的 心 形 词 云图 。 
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12.133 ”百度 中 的 词 云图 


12.4.1 思路 简 析 


2018 世界 杯 期 间 ， 热 搜 榜 上 哪些 词语 点 击 率 高 呢 ? 我 们 怎么 样 才能 快 
速 地 、 直 观 地 获取 相关 的 热点 信息 呢 ? 本 节 将 用 Python 中 词 云图 的 展示 方 
法 ， 为 大 家 展现 2018 世界 杯 的 热点 词语 图 像 描 述 。 

1. 任务 要 求 

了 解 Python 第 三 方 库 分 词 包 (jieba)、 词 云 包 (WordCloud) 的 基本 
使 用 方法 。 

以 《2018 世界 杯 球迷 趋势 分 析 报告 》 为 分 析 对 象 ， 基 于 Python 环境 
搭建 词 云图 开发 环境 ， 完 成 此 文本 的 词 云 图 分 析 。 

2. 环境 要 求 

词 云 图 程序 的 正常 运行 需要 安装 如 下 Python 第 三 方 ; 


常用 库 : 


Matplotlib、NumPy、Pandas、codecs， 另 外 还 要 安装 词 云图 程序 开发 的 专用 
库 : jieba (分词 包 )、WordCloud( 词 云 包 )。 这 里 ， 首 先 通 过 pip install fr 
令 安装 jieba、 WordCloud 库 ， 分 别 如 图 12.14 和 图 12.15 所 示 。 

画 


图 12.14 jieba 库 安 装 


图 12.15. Wordcloud 库 安装 


12.4.5 ”代码 实现 


代码 如 下 所 示 : 


>>> import matplotlib.pyplot as plt 

>>> from wordcloud import WordCloud,ImageColorGenerator,S TOPWORDS 
>>> import jieba 

>>> import numpy as np 

>>> from PIL import Image 

>>> abel mask = np.array(Image.open("D:/python/code/test/love is returned. 
png") 

>>> text from file with apath = open(D/python/code/test/2018wordcup.txt'). 
read() 

>>> wordlist after jieba = jieba.cut(text from file with apath, cut all = True) 
>>> Wl space split = " " join(wordlist after jieba) 

Building prefix dict from the default dictionary ... 

Loading model from cache CAUsers'ADMINI-1VAppDataW oca TempVieba.cache 
Loading model cost 2.740 seconds. 

Prefix dict has been built succesfully. 

>>> my wordcloud = WordCloud( 


width=600, 

height=400, 

background colorz'white', # 设置 背景 颜色 
mask-abel mask, # 设置 背景 图 片 

max, words-400, 3 设置 最 大 现实 的 字数 
stopwords=STOPWORDS, # 设置 停 用 词 


font path-'D:/python/code/test/msyahei.ttf', 
# 设置 字体 格式 ， 如 不 设置 显示 不 了 中 文 


max_font_size=100, # 设置 字体 最 大 值 

prefer horizontal-0.8, 

margin-2, 

random state = 30, # 设置 配色 方案 
Scale-1.5 


).generate(wl space split) 

>>> image colors = ImageColorGenerator(abel mask) 

>>> pltimshow(my wordcloud) 

«matplotlib.image.Axeslmage object at 0x0000021A85EA5AC8» 
>>> plt.axis("off") 

(.0.5, 79.5, 78.5, .0.5) 

>>> plt.show() 


程序 运行 结果 如 图 12.16 所 示 。 


12.16 ”世界 杯 分 析 报告 词 云 图 


12.4.3 ”代码 分 析 


导入 编写 词 云图 所 需 的 第 三 方 库 ， 代 码 如 下 : 


>>> import matplotlib.pyplot as plt 

>>> from wordcloud import WordCloud,ImageColorGenerator,S TOPWORDS 
>>> import jieba 

>>> import numpy as np 

>>> from PIL import Image 


O 定义 词 云图 的 背景 图 片 路 径 和 要 分 析 的 文本 路 径 ， 代 码 如 下 : 
>>> abel_mask = np.array(Image.open("D:/python/code/test/love_is_returned. 
png")) 


>>> text from file with apath = open('D:/python/code/test/2018wordcup.txt'). 
read() 


ORE jieba 的 格式 以 及 分 割 空格 分 隔 符 ， 代 码 如 下 : 


>>> wordlist after jieba = jieba.cut(text from file with apath, cut all = True) 
>>> WI space split = " ".join(wordlist after jieba) 


@ 定 义 云 词类 的 构造 函数 ， 代 码 如 下 : 
>>> my wordcloud = WordCloud( 


width=600, 

height=400, 

background color-'white', # 设置 背景 颜色 
mask=abel_mask, # 设置 背景 图 片 
max_words=400, # 设置 最 大 现实 的 字数 
stopwords=STOPWORDS, # 设置 停 用 词 


font path-'D:/python/code/test/msyahei.ttf', 
# 设置 字体 格式 ， 如 不 设置 显示 不 了 中 文 
max font size-100, # 设置 字体 最 大 值 


prefer horizontal-0.8, 

margin-2, 

random state - 30, # 设置 配色 方案 
scale-1.5 

).generate(wl space split) 


@ 获 取 图 片 的 背景 色 并 生成 词 云图 ， 代 码 如 下 : 
>>> image colors = ImageColorGenerator(abel mask) 
>>> plt.imshow(my wordcloud) 

@ 不 显示 坐标 ， 显 示 生 成 的 词 云图 ， 代 码 如 下 : 


>>> plt.axis("off") 
>>> plt.show() 


125 ”实验 


1. 实验 目的 

@ 掌 握 Matplotlib 库 的 安装 方法 , 能 够 使 用 该 库 中 提供 的 函数 熟练 绘制 
图 像 。 

掌握 Artist 对 象 属性 的 使 用 方法 , 能 够 熟练 地 运用 其 进行 相关 属性 的 
设置 。 

掌握 Pandas 库 的 安装 方法 ， 能 够 熟练 利用 该 库 进行 简单 的 图 像 绘制 。 

2. 实验 内 容 

实验 一 ”Matplotlib 的 安装 和 使 用 

O fs H] Python 提供 的 两 种 库 的 安装 方式 练习 Matplotlib 库 的 安装 。 

O fi: FH Matplotlib 库 完 成 如 图 12.17 所 示 图 形 的 绘制 。 
Set default color cycle to rgby 


x 
aast? A „I 
T J J + 
0 10 


20 30 
Set axes color cycle to cmyk 


12.17 ”绘制 图 形 
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实验 二 ”Artist 对 象 的 使 用 

使 用 Artist 属性 对 Figure 进行 装饰 ， 使 用 常见 的 参数 如 透明 度 、 标 签 
等 属性 对 画布 进行 修饰 。 

实验 三 ”Pandas 库 的 安装 和 使 用 

@ 理 解 Pandas 库 是 Matplotlib 的 子 库 ， 无 需 单独 安装 。 

@ 利 用 Pandas 库 进 一 步 改 造 本 章 中 学 生成 绩 占 比 图 , 如 图 12.12 所 示 ， 
要 求 使 用 Pandas 数据 框 完成 数据 的 载 入 。 
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项 目 实战 : 数据 分 析 


大 数据 时 代 ， 数 据 便 是 掘 金 的 黄金 地 带 。 企 业 大 量 的 历史 数据 能 和 否 发 
挥 其 应 有 的 价值 ， 取 决 于 企业 采用 什么 样 的 分 析 手 段 去 发 气 数 据 本 身 所 区 
含 的 规律 。 数 据 分 析 人 次 炙手可热 ， 已 成 为 大 数据 时 代 企业 争 抢 的 焦点 。 
本 章 将 以 Python 技术 为 基础 , 通过 实际 案例 的 讲解 来 使 大 家 对 数据 分 析 的 
流程 达到 定性 的 认识 。 同 时 ， 通 过 课程 实验 ， 提 高 大 家 的 动手 能 力 ， 为 使 
大 家 成 为 数据 分 析 人 才 做 好 启蒙 教育 。 


13.1 ”数据 清洗 


由 于 采样 数据 中 常常 包含 许多 含有 噪声 、 不 完整 的 、 甚 至 不 一 致 的 数 
据 。 为 了 保证 数据 分 析 的 最 终 目标 质量 ， 必 须 对 数据 进行 预 处 理 ， 以 提高 
采样 数据 的 质量 。 只 有 这 样 ， 才 能 保证 数据 分 析 结果 的 高 质量 。 那 么 ， 如 
何 对 数据 进行 预 处 理 ， 以 改善 数据 质量 呢 ? 数据 清洗 便 是 规范 数据 使 之 达 
到 分 析 标 准 的 最 佳 手段 。 


13.1.1 编码 问题 


通常 ， 源 数据 分 布 在 不 同 的 业务 流程 之 中 。 而 不 同 的 业务 流程 中 对 数 
据 的 要 求 、 理 解 和 规格 各 不 相同 。 导 致 对 同一 数据 对 象 的 描述 千差万别 。 
因此 ， 在 清洗 数据 的 过 程 中 ， 首 先 要 对 数据 的 编码 格式 做 统一 要 求 。 

对 于 数据 项 的 约定 可 从 以 下 几 个 方面 进行 。 

@ 命 名 规则 : 对 于 同一 数据 对 象 ， 其 名 称 应 当 是 唯一 的 。 如 页 面 访问 
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量 这 个 字段 ， 可 能 称 作 访问 深度 、 分 为 PV 数 、 页 面 浏览 量 等 。 

@ 数 据 类 型 : 同一 个 数据 对 象 的 类 型 必须 一 致 ， 而 且 表示 方法 唯一 ， 
如 普通 日 期 和 时 间 戳 的 区 分 。 

@ 计 数 方法 : 对 于 数值 类 型 的 数据 ， 单 位 务必 统一 。 如 重量 单位 ， 干 
克 、 公 斤 、 克 、 斤 等 ， 在 数据 表 中 必须 用 唯一 单位 。 

约束 条 件 : 数据 表 之 间 的 关系 约定 不 能 产生 二 义 性 。 如 表 的 主键 、 
唯一 性 、 外 键 约束 等 。 

总 之 ,编码 问题 是 一 个 比较 繁杂 的 问题 ， 需 要 人 工 的 介入 解决 ， 同 时 ， 
更 需要 相关 决策 者 指定 数据 的 标准 格式 对 之 加 以 约束 。 


13.1.2 ”缺失 值 分 析 


数据 的 缺失 ， 主 要 包括 记录 的 缺失 和 记录 中 某 个 字段 信息 的 缺失 ， 二 
者 都 会 造成 最 终 分 析 结 果 的 不 准确 。 下 面 从 缺失 值 产生 的 原因 及 处 理 方法 
进行 介绍 。 

1. 产生 原因 

缺失 值 产生 的 原因 主要 包括 3 大 类 ， 有 具体 如 下 

O 出 于 信息 安全 的 需求 。 由 于 某 种 原因 无 法 获取 , 或 者 获取 成 本 过 高 。 

© 人 为 的 信息 遗漏 。 可 能 是 由 于 个 人 主观 认识 不 到 位 ， 导 致 的 因 人 为 
因素 产生 的 遗漏 。 也 可 能 是 由 于 数据 获取 设备 的 故障 所 引起 的 非 人 为 原因 
产生 的 丢失 。 

© 字段 值 的 缺失 。 某 些 情况 下 ， 缺 失 值 不 一 定 意味 着 数据 的 错误 。 如 
儿童 的 手机 号 码 、 个 人 收入 等 字段 值 。 

2. 产生 的 影响 

数据 值 的 缺失 ， 通 常会 给 数据 分 析 带 来 如 下 影响 : 

GD 数据 挖掘 建 模 将 丢失 大 量 的 有 用 信息 。 

@ 数 据 挖掘 模型 表现 出 来 的 不 确定 性 更 加 显著 ， 数 据 背 后 蕴含 的 规律 
更 难 发 掘 。 

图 字段 的 空 值 会 导致 数据 分 析 过 程 陷入 混乱 ， 致 使 分 析 产 生 不 可 靠 的 


结果 。 
3. 应 对 策略 
生活 中 我 们 所 采集 到 的 数据 错综复杂 ， 其 值 的 缺失 也 是 很 常见 。 那 么 
我 们 该 如 何 处 理 这 些 缺 失 值 呢 ? 常用 的 有 3 大 类 方法 ， 即 删除 法 、 填 补 法 
和 插值 法 。 

OMRE: 当 数 据 中 的 某 个 变量 大 部 分 值 都 是 缺失 值 ， 可 以 考虑 删除 
该 变量 ;， 当 缺失 值 是 随机 分 布 的 ， 且 缺失 的 数量 并 不 是 很 多 时 ， 也 可 以 删 
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除 这 些 缺 失 的 观测 。 

ORINA: 对 于 连续 型 变量 ， 如 果 变 量 的 分 布 近似 或 就 是 正 态 分 布 的 
话 ， 可 以 用 均值 替代 那些 缺失 值 ; 其 他 情况 ， 可 以 使 用 中 位 数 来 代替 那些 
缺失 值 ， 对 于 离散 型 变量 ， 我 们 一 般 用 众 数 去 蔡 换 那 些 存在 缺失 的 观测 。 

@ 插 补 法 : 是 基于 蒙特 卡 洛 模拟 法 ， 结 合 线性 模型 、 广 义 线性 模型 、 
决策 树 等 方法 计算 出 来 的 预测 值 蔡 换 缺失 值 。 


13.1.3 去除 异常 值 


异常 值 ， 是 指数 据 样本 中 的 个 别 值 ， 其 数值 明显 偏离 对 应 字段 的 所 有 
观察 值 。 异 常 值 又 称 离 群 点 。 异 常 值 的 分 析 是 检验 数据 集中 是 否 存 在 录入 
错误 以 及 不 合 常理 的 数据 。 去 除 异 常 值 的 方法 主要 包括 以 下 两 种 : 

(1) 统计 分 析 法 。 

通常 对 变量 的 取 值 做 一 个 简单 的 量化 统计 ， 尤 其 是 数值 型 字段 。 进 而 
查看 哪些 取 值 超出 合法 取 值 范围 。 最 常用 的 统计 方法 是 求 最 大 值 、 平 均值 、 
最 小 值 。 用 最 小 值 和 最 大 值 确定 正常 取 值 范围 。 用 平均 值 蔡 代 空白 字段 值 ， 
将 超出 合理 取 值 的 记录 剔除 采样 数据 。 例 如 ， 个 人 信息 中 的 年 龄 字段 取 值 
超过 150 就 属于 异常 取 值 ， 可 考虑 用 平均 取 值 蔡 代 。 

(2) 3 8 分 析 法 。 

通常 ， 如 果 数 据 服从 正 态 分 布 , 在 3 5 思想 的 指导 下 ， 噶 常 值 被 认定 为 
与 平均 值 偏差 超过 3 倍 标准 差 的 数值 。 因 为 ， 在 正 态 分 布下 ， 距 离 大 于 3 
倍 标准 差 的 数值 的 概率 小 于 等 于 0.003， 属 于 小 概率 事件 。 相 反 ， 若 数据 字 
段 值 不 服从 正 态 分 布 ， 可 用 远离 平均 值 多 少 倍 标准 差 约 定 异 常数 值 。 


13.1.4 ”去 除 重复 值 与 元 余 信 息 


由 于 各 种 各 样 的 原因 ， 在 获取 的 数据 源 中 ， 经 常 存在 重复 的 字段 、 重 
复 的 记录 以 及 获取 了 与 分 析 主 题 无 关 的 数据 项 。 这 时 ， 为 了 提高 数据 的 质 
量 ， 需 要 对 源 数据 做 去 重 处理 和 元 余 处 理 。 

对 于 重复 数据 的 处 理 ， 我 们 通常 采用 的 方法 是 “排序 合并 ” 具体 做 法 
是 ， 先 将 数据 库 表 中 的 记录 按照 指定 的 规则 排序 ， 然 后 通过 比较 邻近 记录 
是 否 相似 来 检测 记录 是 否 有 重复 。 这 项 工作 包括 排序 和 相似 度 计算 两 个 步 
骤 。 常 用 的 排序 方法 有 插入 排序 、 冒 泡 排序 、 快 速 排序 、 希 尔 排序 等 。 常 
用 的 相似 度 计算 方法 有 基本 的 字段 匹配 算法 、 标 准 的 欧 氏 距离 法 、 相 关系 
Jb. BAS. 

另外 ， 需 要 注意 的 是 ， 对 重复 的 数据 项 ， 尽 量 通过 具体 分 析 主 题 确定 
相关 提取 规则 。 在 数据 清洗 阶段 ， 对 重复 的 数据 切 勿 轻易 地 进行 删除 。 尤 


是 不 能 将 与 分 析 主题 相关 的 重要 业务 数据 过 滤 掉 。 

对 于 与 分 析 主 题 无 关 的 数据 项 ， 即 我 们 通常 说 的 元 余 信 息 ， 同 样 ， 也 
不 可 直接 剔除 出 数据 源 。 而 需要 根据 制定 的 提取 规则 通过 子 表 的 形式 ， 生 
成 新 的 和 分 析 主 题 相关 的 数据 表 。 


13.2 ”数据 存 取 
数据 存 取 是 数据 分 析 的 基础 ， 尤 其 是 面 对 海 量 数据 ， 数 据 的 存 取 方式 


显得 尤为 重要 。 本 节 以 Pandas 库 对 象 为 基础 重点 介绍 Python 数据 分 析 中 常 
见 的 几 种 数据 存 取 方法 。 


13.2.1 CSV 文件 存 取 


CSV (Comma.Separated Value， 逗 号 分 隔 值 ) 是 一 种 常见 的 文件 格式 。 
通常 ， 数 据 库 的 转 存 文件 就 是 CSV 格式 的 ， 文 件 中 的 各 个 字段 对 应 于 数据 
库 表 中 的 列 。 在 Pandas 中 可 以 使 用 read_csv0 函 数 将 .csv 数据 读 入 程序 。 
例如 , 读 取 学 生成 绩 数 据 , 首先 创建 一 个 stuscore.csv 文件 , 如 图 13.1 所 示 ， 
然后 使 用 pandas 对 象 的 read_csv0 函 数 读 取 并 显示 数据 。 


4» stuscore.csv 


80. 
70. 
60. 


87, 
62, 
78, 
90 


13.1 学 生成 绩 csv 文件 
程序 示例 代码 如 下 : 


import pandas as pd 

import numpy as np 

data = pd.read csv( /stuscore.csv') 
print(data) 


运行 结果 如 图 13.2 所 示 。 


first.py 


pandas pd 
| numpy as np ) 
data pd.read csv('./stuscore.csv') 
þrint(data)) 


*REPL* [python] 


Repl Closed 


13.2 Pandas 读 取 学 生成 绩 数据 
从 结果 可 知 ， 正 确 读 取 数 据 ， 这 里 需要 注意 的 是 文件 路 径 问 题 。 需 要 
保证 first.py 与 stuscore.csv 文件 在 同一 文件 层次 上 。 
同样 ， 可 以 通过 to_csv0 函 数 将 数据 写 入 csv 格式 的 文件 。 首 先 通过 
Pandas 对 象 创建 一 个 info.csv， 程 序 代 码 如 下 : 


>>> import pandas as pd 

>>> import numpy as np 

>>> import matplotlib.pyplot as plt 

>>> names = [ 张 三 , 李 四 ',' 王 五 ,' 赵 六 ", 郭 七 ] 

>>> ages = [20,19,23,18,19] 

>>> DataSet = list(zip(names,ages)) 

>>> DataSet 

[( 张 三 , 20), ( 李 四 ', 19), ( 王 五 , 23), (' 赵 六 ', 18), ( 郭 七 , 19)] 

>>> df = pd.DataFrame(data = DataSet ,columns =[Name', Age]) 
>>> df ”# 输 出 pandas 对 象 创建 的 数据 表 


Name Age 
0 张 三 20 
1 李 四 19 
2 ER 23 
3 BA 18 
4 t 19 


>>> dfto csv('/info.csv'index = False,header = False) # 将 生成 的 数据 df 写 入 
info.cvs 


然后 ， 读 取 info.csv 文件 ， 用 于 验证 info.csv 文件 创建 成 功 ， 示 例 代码 


如 下 : 


>>> data = pd.read csv( /info.csv') # 读 取 info.csv 中 的 数据 以 验证 写 入 成 功 
>>> print(data) 

张 三 20 

李 四 19 

PR 23 

赵 六 18 

郭 七 19 


>>> 


AUN- O 


13.2.2 JSON 文件 的 存 取 


被 广 
以 用 


也 提 


JavaScript Object Notation (简称 Json), 是 一 种 与 平台 无 关 的 数据 格式 ， 
泛 地 用 于 应 用 或 系统 间 的 数据 交换 。Pandas 提供 的 read. jsonQ ER IG, 可 
来 创建 pandas Series 或 者 pandas DataFrame 数据 结构 。 同 时 ，Pandas 
HET to_json() 函 数 用 以 完成 数据 框 或 序列 到 json 格式 的 转换 。 关 于 


Pandas 对 json 数据 的 存 取 比 较 简单 ， 这 里 通过 一 个 简单 的 示例 来 说 明 二 者 
之 间 的 转换 关系 ， 如 图 13.3 所 示 。 


print(data.to_json()) 


1» *REPL* [python] 


name Bill 
country Netherlands 


Repl Closed 


133 json 对 象 与 Pandas 序列 的 转换 
上 述 程序 使 用 Pandas 自 带 的 read json 及 to json 直接 解析 json 字符 串 。 


【提示 】 

大 家 也 可 采用 json 的 loads 和 Pandas 的 json_normalize 进行 解析 , 或 使 
用 json 的 loads 和 Pandas 的 DataFrame 直接 构造 (这 个 过 程 需要 手动 修改 
loads 得 到 的 字典 格式 )。 关 于 这 两 种 方式 如 何 实现 , 请 学 有 余力 的 朋友 借助 
互联 网 自行 学 习 。 


13.2.3 XLSX 文件 的 存 取 


使 用 pandas 读 取 Excel 电子 表格 中 的 数据 ， 需 借助 第 三 方 库 xlrd 完成 
Excel 表 数 据 的 读 写 操作 。 用 read_excel() 函数 完成 Excel 电子 表格 中 数据 
的 读 取 , 用 to_excel0 函 数 完成 数据 pandas DataFrame 中 的 数据 写 入 Excel。 

为 了 完成 Excel 电子 表格 中 数据 的 存 取 ， 先 来 完成 Python 第 三 方 库 
openpyxl. xlsxwriter, xlrd 的 安装 。 这 里 ， 还 是 使 用 pip install 命令 完成 ， 
分 别 如 图 13.4 一 图 13.6 所 示 。 

Bs 


图 13.4 openpyxl 库 的 安装 


里 安装 的 是 openpyxl 的 2.5.4 版 本 。 
画 


图 13.5 xlsxwriter 库 安 装 


这 里 安装 的 是 xlsxwriter 1.0.5 版 本 。 


图 13.6 xird 库 的 安装 
这 里 安装 的 是 xlrd 1.1.0 版 本 。 
接 下 来 ， 通 过 简单 的 示例 来 演示 如 何 使 用 pandas 对 象 对 Excel 文件 进 
行 读 写 操作 。 
读 取 Excel 文件 中 的 数据 ， 示 例 Excel 数据 如 图 13.7 所 示 。 


À C D 
1 name score 
2 | 张 三 370 
s FN 500 
4 Ih 600 
5 | 赵 六 580 
e Bt 700 


137 Excel 示例 数据 

首先 ， 用 pandas 的 数据 框 来 创建 如 图 13.7 所 示 的 Excel 数据 表 ， 然 后 
将 创建 的 Excel 表 的 数据 输出 ， 如 图 13.8 所 示 ， 再 将 文件 读 入 程序 并 显示 ， 
程序 代码 如 下 : 

>>> import pandas as pd 

>>> df out = pd.DataFrame([(' 张 三 '， 三 一 班 ,370),( 李 四 '， 三 二 班 ,500)，(' 王 五 

三 三 班 ' ,600),( 赵 六 ', '——3:,580)(9847', '— — 31,700), columns-[name', 

"class', score]) 

>>> df outto excel('stuscore.xlsx') # 生成 Excel 文件 


>>> pd.read excel('stuscore.xlsx') #i 读 取 Excel 文件 
name class score 


0 3E 370 
1 s 500 
DEMCECH 600 
s z— 580 


4 Nt zz 700 


df out 写 入 的 Excel 文件 通常 位 于 Python 的 安装 目录 下 ， 如 图 13.8 
所 示 。 
E python.exe 
python3.dll 
python36.dll 
D pythonw.exe EE 


| stuscore.xlsx K 


图 13.8 pandas 生成 的 Excel 文件 位 置 
13.2.4. MySQL 数据 库 文件 的 存 取 


大 数据 时 代 ， 海 量 的 数 ini et qudd MySQL 作为 一 
种 开源 的 关系 型 数据 库 ， 受 到 中 小 企业 的 青睐 。 本 节 将 以 MySQL 数据 为 对 
象 ， 讲 解 Pandas 对 象 是 如 何 对 其 数据 进行 存 取 的 。 以 学 生成 绩 单 为 
例 ，MySQL 数据 源 示例 如 图 13.9 所 示 。 


图 13.9 MySQL 数据 源 


关于 MySQL 的 安装 和 使 用 这 里 不 再 袭 述 , 有 不 明白 的 读者 可 从 互联 网 
找 相关 的 资料 进行 学 习 。 

首先 , 来 演示 如 何 从 MySQL 数据 库 中 获取 scores 学 生成 绩 表 ,示例 代 
码 如 下 : 


这 里 ， 首 先 要 安装 第 三 方 库 MySQL， 同 样 ， 采 用 pip install 命令 完成 。 
pip install mysql 
但 系统 提示 如 下 错误 : 


_mysql.c 

_mysql.c(42): fatal error C1083: Cannot open include file: 'config.win.h': No 
such file or directory 

error command 'C:\\Program Files (x86)Microsoft Visual Studio 
14.0NVCWBINWx86 amd64Wcl.exe' failed with exit status 2 


因此 我 们 使 用 第 一 种 方式 ， 即 直接 下 载 对 应 的 安装 包 进 行 安装 。IE Vj 
问 网 址 为 https://pypi.org/project/mysqlclient/#files。 
打开 mysqlclient 1.3.12 安装 包 ， 下 载 界面 如 图 13.10 所 示 。 


Navigation Download files 


Download the file for your platform. If you're not sure which to choose, le 


© Release history 


$È Downloadfiles 


Project links 


Filename, size & hash @ 


O Homepag 


图 13.10. MySQL 库 下 载 界面 
如 图 13.9 所 示 , FAX cp36m.win_admin64.whl 即 可 , 将 其 保存 到 Python 
安装 程序 Scripts 文件 夹 内 ， 使 其 和 pip.exe 位 于 同一 目录 。 在 DOS 下 运行 
如 下 命令 : 
D:\python\Scripts> pip install mysglclient.1.3.12.cp36.cp36m.win amd64.whl 


安装 运行 结果 如 图 13.11 所 示 。 


图 13.11 MySQL 库 安 装 
至 此 ， 完 成 了 Python.Mysql 第 三 方 库 的 安装 。 如 图 13.11 所 示 ， 再 尝试 
pip install mysqlclient 命令 安装 该 包 ， 提 示 已 存在 。 


接 下 来 , 就 可 以 使 用 mysqlclient 来 访问 MySQL 数据 库 , 示例 代码 如 下 : 


>>> import MySQLdb 
>>> cnx- MySQLdb.connect(user-'root' password-'123456' host-'127.0.0.1', 
database-'stu') 
Traceback (most recent call last): 
File "«pyshell£25-", line 5, in «module» 

database-'stu') 

File "D:pythonViblsite.packagesMySQLdb!connections.py", line 204, in _init 
super(Connection, self). init (*args, **kwargs2) 

..mysql exceptions.OperationalError: (2059, <NULL>) 


虽然 第 三 方 库 安 装 成 功 ， 但 数据 库 连 接 报错 ! 2059 原因 不 详 ! 经 查询 
百度 ， 大 概 原因 是 MySQL 版 本 升级 到 8.0.11， 更 改 新 的 加 密 方式 导致 的 错 
误 ， 怎么 办 ? 不 抛弃 不 放弃 ， 用 试 错 的 方法 继续 尝试 。 
使 用 第 三 方 库 PyMySQL 尝试 ，pip 命令 安装 如 图 13.12 所 示 。 


图 13.12 PyMySQL 库 的 安装 
第 一 步 ， 安 装 没 问题 。 前 进 ! 尝试 访问 MySQL 数据 库 。 
>>> import pymysql 
>>> cnx= MySQLdb.connect(user-'root', password-'123456' host-'127.0.0.1', 
database-'stu') 
Traceback (most recent call last): 
File "<pyshell#27>", line 5, in «module»database-'stu') 
File "D:WpythonWibsite.packagesMySQLdb| init .py", line 86, in Connect 
return Connection(*args, **kwargs) 
File "D:pythonWMiblsite.packages:MySQLdb!connections.py", line 204, in 
. init. 
super(Connection, self). init (*args, **kwargs2) 
..mysql exceptions.OperationalError: (2059, <NULL>) 


>>> 
如 上 ， 由 数据 库 连 接 错误 提示 可 知 ，pymysql 库 同 样 出 现 2059 错误 ! 
换 种 思路 ， 继 续 尝试 。 
这 里 ， 尝 试 第 三 方 库 mysglconnectorPython 的 安装 。 同 样 ， 采 用 pip 
install 命令 完成 。 在 DOS 下 输入 如 下 命令 : 


pip install mysql.connector.python 


安装 结果 如 图 13.13 所 示 。 


图 13.13 mysql.connector.Python 库 的 安装 
如 图 13.13 所 示 ， 从 安装 结果 可 知 ， 该 第 三 方 库 支 持 最 新 的 MySQL 
8.0.11. 
接 下 来 ， 通 过 Python Shell 尝试 一 下 能 否 正常 访问 MySQL 数据 库 中 的 
表 数据 ， 代 码 如 下 : 
@ 导 入 mysql.connector 库 ， 判 断 其 是 否 能 正常 工作 。 


>>> import mysql.connector as ms 
>>> ms. version . 
'8.0.11' 


太 好 了 ， 能 够 正常 显示 MySQL 的 版 本 号 ! 应 该 可 以 正常 工作 ， 继 续 ! 


>>> cnx= ms.connect( 
user-'root', 
password-'123456', 
host-'127.0.0.1', 
database-'stu') 
>>> cursor -cnx.cursor() 
>>> cursor.execute("select * from scores") 
>>> result = cursor.fetchall() 
>>> print(result) 
(E= p 370) apu —BH 500) CEE — WEL600)n (BA E 
班 , 580), ( 郭 七 ' 三 三 班 , 700)] 


>>> 

成 功 了 ! 终于 可 以 正常 获取 MySQL 数据 库 中 的 数据 啦 ! 激动 之 余 ， 别 
忘 了 在 访问 完 MySQL 之 后 ， 及 时 关闭 链接 。 

cnx.close() 

【提示 】 

通过 MySQL 第 三 方 库 的 安装 ， 我 们 不 难 理解 这 样 一 个 道理 :“ 方 法 总 
比 问题 多 ”， 又 或 “条 条 大 道 通 罗 马 ”。 其 实 任 何事 情 都 是 这 样 ， 不 断 尝 试 
是 最 好 的 办 法 。 编 程 也 是 这 样 ， 养 成 良好 的 解决 问题 的 生活 态度 ， 对 编程 
至 关 重 要 。 误 打 误 撞 ， 笔 者 也 是 第 一 次 使 用 最 新 版 的 MySQL 8.0.11， 结 果 


衍生 出 一 种 学 习 态度 ! 即兴 就 将 其 写 在 这 里 。 如 果 您 遇 到 类 似 的 困难 ， 怎 
么 办 ? 请 记 住 “方法 总 比 问 题 多 ”。 
另外 ，2059 错误 的 根源 是 新 版 本 的 MySQL 使 用 的 是 caching sha 
2_password 验证 方式 ， 但 此 时 的 navicat 还 没有 支持 这 种 验证 方式 。 由 于 在 
命令 行 中 登录 数据 库 时 不 会 出 现 2059 错误 , 因此 可 在 命令 行 中 登录 数据 库 ， 
执行 下 面 的 命令 。 
ALTER USER 'root'Qlocalhost' IDENTIFIED WITH mysql native password BY 
123456"; 
注意 , 123456 为 笔者 MySQL 数据 库 密 码 , 至 此 , 彻底 解决 2059 错误 。 
当然 ， 也 可 以 选择 低 版 本 的 MySQL 数据 库 来 避免 2059 错误 。 
言 归 正 传 ， 如 何 使 用 Pandas 获取 MySQL 中 数据 库 表 中 的 数据 ? 示例 
代码 如 下 : 
>>> import pandas as pd 
>>> import mysql.connector as ms 
>>> Cnx= ms.connect( 
user-'root', 
password-'123456', 
host-'127.0.0.1', 
database-'stu') 


>>> sql = "SELECT * FROM scores" 
>>> df = pd.read sql(sgl,con-cnx) 


>>> print(df) 

name class Score 
MA ES S 
1 500 
2 600 
3 580 
4 700 


如 上 pandas 对 象 从 数据 库 中 获取 的 数据 ， 与 图 13.9 MySQL 数据 库 中 
的 表 stu 中 的 数据 比 对 一 致 ， 至 此 , 通过 Pandas 从 MySQL 表 中 获取 数据 的 
任务 顺利 完成 。 

接 下 来 ， 学 习 如 何 将 pandas 中 的 数据 存储 到 MySQL 数据 库 的 表 中 ， 
依旧 以 stu 数据 库 为 例 。 

这 里 为 了 完成 pandas 数据 框 中 的 数据 写 入 MySQL 的 任务 ， 首 先 需 要 
安装 支撑 这 一 任务 的 链接 器 第 三 方 Python 库 sqlalchemy。 仍 然 使 用 pip install 
命令 完成 安装 ， 如 图 13.14 所 示 。 


图 13.14 sqlalchemy 库 安 装 
做 好 准备 工作 , 接 下 来 完成 pandas 数据 框 数据 写 入 MySQL 这 一 任务 ， 
演示 代码 如 下 : 


>>> import pandas as pd 
>>> 


>>> import pymysql 
>>> from sglalchemy import create engine 


>>>conn = 
create_engine('mysql+mysqldb://root:123456@localhost:3306/stu?charset= 
utf8') 

>>> df -pd.DataFrame(('name'['] —',] —',J] "class [—— E, EEE 


三 三 班 '],'score':[600,700,660]}) 
>>> df.to_sql(name = 'scores',con = conn,if exists = 'append'index = 
False,index label = False) 
然后 ， 通 过 Win+R 快捷 键 打开 “运行 ”对 话 框 , 输入 CMD 进入 DOS, 
进入 MySQL 控制 台 ， 查 看 scores 表 中 的 内 容 ， 如 图 13.15 所 示 。 
画 


图 13.15 pandas 数据 写 入 MySQL 


如 图 13.15 所 示 ， 我 们 已 成 功 将 df 中 的 数据 写 入 MySQL 数据 库 stu 的 
scores 表 中 。 

另外 ， 也 可 以 将 pandas 中 的 数据 重新 建 一 个 表单 独 存放 ， 很 简单 ， 只 
需 将 上 面 示 例 代码 中 的 表 名 更 改 一 下 即 可 。 


dfto_sql(name = 'newscore'con = Cconn,if exists = "append',index = 
False,index_label = False) 


运行 结果 如 图 13.16 所 示 。 


13.16 pandas 建新 表 newscore 


至 此 ， 关 于 数据 存 取 的 方法 讲解 完毕 ， 学 有 余力 的 读者 可 以 尝试 这 几 
种 方法 的 混合 使 用 ， 如 如 何 通 过 Pandas 实现 xlsx 到 MySQL 的 转换 。 


13.3 NumPy 

NumPy 即 Numeric Python 的 缩写 ， 是 一 个 优秀 的 开源 科学 计算 库 。 
NumPy 为 我 们 提供 了 丰富 的 数学 函数 、 强 大 的 多 维 数组 对 象 及 强大 的 运算 
性 能 。 本 节 将 对 NumPy 做 简单 介绍 ， 并 重点 讲解 其 基本 的 操作 。 


13.3.1 NumPy 简介 


NumPy (Numerical Python 的 缩写 ) 是 一 个 开源 的 Python 科学 计算 库 。 
使 用 NumPy， 就 可 以 很 方便 地 使 用 数组 和 矩阵 。 NumPy 包含 很 多 实用 的 数 
学 函数 ， 涵 盖 线 性 代数 运算 、 傅 里 叶 变 换 和 随机 数 生成 等 功能 。 

NumPy 已 成 为 Python 科学 计算 生态 系统 的 重要 组 成 部 分 ， 其 在 保留 
Python 语言 优势 的 同时 大 大 增强 了 科学 计算 和 数据 处 理 的 能 力 。 更 重要 的 
是 ，NumpPy 与 SciPy. Matplotlib 等 其 他 众多 Python 科学 计算 库 很 好 地 结合 
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在 一 起 ， 共 同 构建 了 一 个 完整 的 科学 计算 生态 系统 。 一 句 话 ，NumPy 是 使 
用 Python 进行 数据 分 析 的 一 个 必 备 工具 。 


13.3.2 NumPy 基础 


1. NumPy 数组 对 象 

NumPy 中 的 ndarray 是 一 个 多 维 数组 对 象 ， 该 对 象 由 描述 数据 的 元 数 
据 和 数据 本 身 两 部 分 组 成 。 通 常 ， 大 部 分 的 操作 仅仅 是 针对 修改 描述 数据 
的 元 数据 部 分 ， 而 不 改变 实际 数据 本 身 。NumPy 中 的 数组 一 般 是 同 质 的 ， 
亦 即 数据 的 类 型 是 一 致 的 ， 这 样 的 规定 最 大 的 好 处 在 于 方便 估算 数组 所 需 
的 存储 空间 。 

与 Python 类 似 ，NumpPy 数组 的 下 标 也 是 从 零 开始 的 。ndarray 中 的 每 
个 元 素 在 内 存 中 使 用 相同 大 小 的 块 。ndarray 中 的 每 个 元 素 是 数据 类 型 对 象 
的 对 象 〈 称 为 dtype)。 从 ndarray 对 象 提取 的 任何 元 素 〈 通 过 切片 ) 由 一 个 
数组 标量 类 型 的 Python 对 象 表示 。 如 图 13.17 所 示 显 示 了 ndarray、 数 据 类 
型 对 象 (dtype) 和 数组 标量 类 型 之 间 的 关系 。 


ndarray 
图 13.17 ndarray 数组 结构 


通常 ，ndarray 对 象 是 使 用 NumPy 中 的 数组 函数 创建 的 ， 定 义 如 下 : 


NumPy.array(object, dtype = None, copy = True, order = None, subok = False, 
ndmin = 0) 


参数 的 含义 如 表 13.1 所 示 。 


表 13.1 ndarray 对 象 的 参数 


& x 


任何 暴露 数组 接口 方法 的 对 象 都 会 返回 一 个 数组 或 任何 〈 棋 套 ) 
序列 


dtype 数组 的 所 需 数 据 类 型 ， 可 选 

copy 可 选 ， 默 认为 True， 对 象 是 否 被 复制 

order C ( 按 行 ) 、F GEPID 或 A〈 任 意 ， 默认 ) 

默认 情况 下 ， 返 回 的 数组 被 强制 为 基 类 数组 。 如 果 为 True, W 


返回 子 类 


£ X 


指定 返回 数组 的 最 小 维 数 


ndimin 


创建 数组 最 简单 的 办 法 就 是 使 用 array 函数 ， 可 以 通过 array 函数 传递 
Python 的 序列 对 象 创建 数组 ， 如 图 13.18 所 示 。 


图 13.18 NumPy 数组 创建 
数组 的 元 素 类 型 可 以 通过 dtype 属性 获得 ， 通 过 dtype 参数 在 创建 时 指 
定 元 素 类 型 ， 示 例如 图 13.19 所 示 。 


p. array([[ Lt 


13.19 dtype 参数 的 使 用 
然而 , 通过 创建 Python 序列 , 借助 array 函数 将 序列 转换 为 数组 的 效率 
不 高 。 为 此 NumPy 专门 提供 了 很 多 用 来 创建 数组 的 内 置 函数 ， 举 例如 下 : 

O arange() 函 数 : 通过 指定 开始 值 、 终 止 值 和 步 长 来 创建 一 维 数 
组 ,数组 不 包含 终止 值 。 

O linspace(O) 函 数 : 通过 指定 开始 值 、 终 值 和 元 素 个 数 来 创建 一 维 
数组 ， 可 以 通过 endpoint 关键 字 指定 是 否 包括 终 值 ， 默 认 设置 
是 包括 终 值 。 

O logspace(0 函 数 和 linspace() 函 数 类 似 ， 不 过 它 创 建 等 比 数列 ， 
如 图 13.20 所 示 。 


图 13.20 NumPy 内 置 数组 函数 


2. NumPy 多 维 数组 
多 维 数组 有 多 个 轴 ， 因 此 它 的 下 标 需 要 用 多 个 值 来 表示 ，NumPy 采用 
组 元 〈tuple) 作为 数组 的 下 标 。 其 基本 属性 如 下 。 
OQ 轴 (axis) : 每 一 个 线性 的 数组 称 为 一 个 轴 ， 也 就 是 维度 
(dimensions) ， 用 ndarray.shape 表示 。 例 如 ， 二 维 数组 相当 
于 两 个 一 维 数 组 的 嵌 套 ,其 中 第 一 个 一 维 数 组 中 每 个 元 素 又 是 
-个 一 维 数组 ， 因 而 ， 一 维 数组 就 是 ndarray 中 的 轴 ， 第 一 个 
轴 《〈 也 就 是 第 0 轴 ) 相当 于 一 个 容器 数组 ， 第 二 个 轴 (也 就 是 
第 1 轴 ) 是 容器 数组 中 的 数组 。 
O 秩 Crank) : 维 数 ， 一 维 数组 的 秩 为 1， 二 维 数组 的 秩 为 2， 
以 此 类 推 ， 即 轴 的 个 数 ， 用 ndarray.ndim 表示 o 
如 图 13.21 所 示 ，a 为 一 个 5X5 的 数组 逻辑 结构 示意 图 ， 可 以 看 成 由 5 
个 一 维 数组 构成 , 每 个 一 维 数组 包含 5 个 元 素 ; 第 一 维 被 称 为 第 0 轴 ( 列 )， 
第 二 维 被 称 为 第 1 轴 ( 行 );， 秩 为 2， 维 度 为 (5，5)， 元 素 总 个 数 为 25。 


一 | 


L 
图 13.21 二 维 数组 5X5 结构 示意 
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代码 实现 过 程 如 图 13.22 所 示 ， 其 中 ndarray.ndmin 代表 数组 的 维 数 ， 
ndarray.shape 代表 数组 在 每 一 维 上 元 素 的 多 少 ，ndarray.size 代表 数组 中 元 
素 个 数 ，ndarray.dtype 代表 数组 元 素 的 类 型 ，ndarray.itemsize 代表 元 素 所 占 
存储 空间 的 大 小 。 


Python 3.6.5 (v3.6.5:f59c0932b4, Mar 28 2018, 17:00:18) [MSC v.1900 64 bit (AMD64)] on win32 
Type "copyright", "credits" or "license()" for more information. 
»»» import numpy as np 
>>> h = nparray([(0,1,2,3,4),(5,6,7,8,9),(10,11,12,13,14),(15,16,17,18,19),(20,21,22,23,24)]) 
>>>h 
array([[O, 1, 2, 3, 4], 
[5, 6, 7, 8, 9], 
[10, 11, 12, 13, 14], 
[15, 16, 17, 18, 19], 
[20, 21, 22, 23, 24]]) 
»»» h.ndim 
2 
»»» h.shape 
(5,5) 
>>> h.size 
25 
»»» h.dtype 
dtype('int32') 
»»» h.itemsize 
4 
>>> 


13.22 ”二 维 数组 5X 5 代码 实现 

3. Ndarray 元 素 存 取 

NumPy 中 数组 的 存 取 方法 和 Python 标准 的 方法 相同 。 其 存 取 方 式 依次 
介绍 如 下 。 

对 于 一 维 数组 ， 其 操作 类 似 于 Python 中 的 listo 用 整数 作为 下 标 可 以 获 
取 数 组 中 的 某 个 元 素 ， 例 如 : 

>>> import numpy as np 

>>> a = np.arange(10) 

>>> a[7] 

Jui 

>>> 

用 范围 作为 下 标 获 取 数 组 的 一 个 切片 ， 但 不 包括 起 始 元 素 和 终止 元 素 ， 
相当 于 数组 的 子 集 。 例 如 : 

>>> a[3:5] 

array([3, 4]) 

在 获取 指定 数组 的 一 个 切片 时 ， 可 以 省 略 起 始 位 置 或 结束 位 置 。 默 认 
表示 从 第 零 个 元 素 开始 或 直至 最 后 一 个 元 素 。 例 如 : 
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>>> a[7] 

array([0, 1, 2, 3, 4, 5, 6]) 
-- a[3:] 

array([3, 4, 5, 6, 7, 8, 9]) 
>>> 


在 获取 数组 元 素 时 ， 下 标 也 可 用 负数 指定 ， 表 示 从 后 向 前 截取 元 素 。 


例如 : 


>>> a[3:-5] 
array([3, 4]) 


>>> 


另外 ， 也 可 以 通过 指定 下 标 修 改 数组 的 元 素 。 例 如 : 


>>> a[3:7] =116,117,118 
Traceback (most recent call last): 
File "<pyshell#30>", line 1, in <module> 

a[3:7] =116,117,118 
ValueError: cannot copy sequence with size 3 to array axis with dimension 4 
>>> a[1:3]=110,112 
>> a 
aray([ 0,110,112, 3, 4, 5, 6, 7, 8, 9] 
>>> 


【提示 】 
@ 在 修改 数组 数据 时 ， 可 修改 元 素 限 两 个 以 内 ， 和 否则 报 迭 代 错 误 。 
@ 需 要 注意 的 是 ，NumPy 和 Python 的 列表 序列 不 同 ， 通 过 下 标 所 获取 


的 新 的 子 集 数 值 切片 是 父 数组 的 一 个 视图 ， 它 与 父 数组 共享 同一 存储 空间 。 


@ 多 维 数组 的 存 取 。 
多 维 数组 的 存 取 和 一 维 数组 类 似 ， 因 为 多 维 数组 有 多 个 轴 ， 因 此 它 的 


下 标 需 要 用 多 个 值 来 表示 。 以 二 维 数组 为 例 ， 结 合 图 13.21，5 X5 二 维 数组 
操作 举例 如 下 : 


>>> import numpy as np 

>>> h = nparray([(0,1,2,3,4),(5,6,7,8,9),(10,11,12,13,14),(15,16,17,18,19),(20, 

21,22,23,24)]) 

>>>h 

array([[0, 1, 2, 3, 4] 
[5, 6; 7, 8 
[10, 11, 12, 13, 14], 
[15, 16, 17, 18, 19], 
[20, 21, 22, 23, 24]) 

>>> h[1,3:5] 

array([8, 9]) 
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>>> h[3:,3:] 

array([[18, 19], 
[23, 24]]) 

>>> h[:,3] 

array([3, 8, 13, 18, 23]) 

>>> h[..:] 

array([[0, 1, 2, 3, 4] 
[5 6 T 8; A; 
[10, 11, 12, 13, 14], 
[15, 16, 17, 18, 19], 
[20, 21, 22, 23, 24]]) 


>>> 


13.4 RHAN: 房 天 下 西安 二 手 房 数 据 分 析 


数据 分 析 是 指 用 适当 的 统计 分 析 方 法 对 收集 来 的 大 量 数 据 进 行 分 
析 ， 提 取 有 用 信息 和 形成 结论 而 对 数据 加 以 详细 研究 和 概括 总 结 的 过 
程 。 它 是 数据 挖掘 的 基础 ， 做 好 数据 的 分 析 ， 才 能 保障 数据 挖掘 的 可 靠 
性 。 数 据 分 析 有 极 广泛 的 应 用 范围 。 通 常数 据 分析 可 划分 为 三 类 。 

@ 探 索性 分 析 : 源 数 据 可 能 杂乱 无 章 ， 看 不 出 规律 ， 通 过 作 图 、 造 表 ， 
用 各 种 形式 的 方程 拟 合 ， 计 算 某 些 特征 量 等 手段 探索 规律 性 的 可 能 形式 ， 
即 往 什么 方向 和 用 何 种 方式 去 寻找 和 揭示 隐 含 在 数据 中 的 规律 性 。 

@ 假 设 模型 分 析 : 在 探索 性 分 析 的 基础 上 提出 一 类 或 几 类 可 能 的 模型 ， 
然后 通过 进一步 的 分 析 从 中 挑选 一 定 的 模型 。 

@ 理 论 推断 分 析 : 通常 使 用 数理 统计 方法 对 所 定 模型 或 估计 的 可 靠 程 
度 和 精确 程度 做 出 推断 。 

这 3 种 分 析 方法 ， 逐 次 递 进 ， 探 索性 分 析 是 其 他 分 析 的 基础 。 通 常 ， 
我 们 把 探索 性 分 析 称 为 数据 分 析 ， 而 后 两 者 统称 数据 挖掘 。 

本 节 以 房 天 下 西安 站 二 手 房 源 数据 为 分 析 对 象 ， 使 用 NumPy + Pandas 
库 对 数据 进行 探索 性 分 析 。 


13.4.4. 思路 简 析 


“人 才 新 政 ” 使 古老 的 西安 生机 盘 然 , 焕发 活力 。 伴 随 人 口 的 大 量 涌 入 ， 
住房 这 个 古老 的 话题 ， 和 炙手可热 。 如 何在 茫茫 房 海中 寻找 中 意 的 她 呢 ? 本 
节 将 以 房 天 下 西安 二 手 房 数 据 包 为 分 析 对 象 ， 首 先 通过 Pandas 对 象 将 其 从 
Excel 电子 表格 中 导入 数据 框 中 。 然 后 ， 对 房 源 数据 进行 清洗 。 最 后 ， 对 各 
关键 字段 进行 相应 的 可 视 化 处 理 ， 通 过 直观 可 视 的 图 像 ， 帮 你 寻找 中 意 
的 “她 ”。 
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代码 如 下 所 示 : 


>>> import pandas as pd 
>>> import NumPy as np 
>>> import matplotlib.pyplot as plt 
>>> df = pd.read csv(ftx xian2.csv',encoding-'gbk") 
>>> df.info() 
>>> len(df.title.unique()) 
>>> df duplicates =df.drop_duplicates(subset = 'title',keep -'first") 
>>> df duplicates.info() 
>>> df notnull = df duplicates.dropna() 
>>> df notnull.info() 
2»»df clean 
df duplicates[['housetype',floor','orientation''yearbuilt','"Street' 'area', 'unitprice']] 
>>> df clean.head() 
>>> df clean.yearbuilt.value counts() 
>>> import matplotlib.pyplot as plt 
>>> plt.style.use('ggplot") 
>>> df clean.yearbuilt.hist() 
*matplotlib.axes. subplots.AxesSubplot object at OX000002BF8F604E48» 
>>> df clean.boxplot(column = 'unitprice',by-'yearbuilt") 
«matplotlib.axes. subplots.AxesSubplot object at 0X000002BF90F73AC8» 
>>> plt.show() 
>>> from matplotlib.font manager import FontProperties 
>>> font zh = FontProperties(fname -"msyahei.ttf") 
>>> df label = df clean.boxplot(column = 'yearbuilt',:by-'Street") 
>>> for label in df label.get xticklabels(): 
label.set fontproperties(font zh) 
>>> plt.show() 


13.4.8 ”代码 分 析 


(1) 导入 数据 分 析 需 要 的 库 。 


>>> import pandas as pd 
>>> import NumPy as np 
>>> import matplotlib.pyplot as plt 


(2) 导入 数据 源 并 浏览 数据 源 的 基本 信息 。 


>>> df = pd.read csv(ftx xian2.csv',encoding-'gbk) 
>>> df.info() 


结果 如 图 13.23 所 示 。 
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[ly Python 3.6.5 She 
File Edit Shell Debug Options Window Help. 
>>> df.info() 
«class 'pandas.core.frame.DataFrame'» 
Rangelndex: 31026 entries, O to 31025 
Data columns (total 18 columns): 
title 30973 non-null object 
mastermap 30973 non-null object 
link 30973 non-null object 
housetype — 30973 non-null object 
floor 30973 non-null object 
orientation — 30558 non-null object 
yearbuilt 30393 non-null float64 
city 31026 non-null object 
district 31026 non-null object 
Street 31026 non-null object 
community 30973 non-null object 
address 30973 non-null object 
owner 30257 non-null object 
area 30973 non-null float64 
price 30973 non-null float64 
unitprice — 30973 non-null float64 
pageaddr 31026 non-null object 
speciallabel 24648 non-null object 
dtypes: float64(4), object(14) 
memory usage: 4.3+ MB 
>>> 

13.23 数据 源 info() 


如 图 13.23 所 示 , 不 难 发 现 , 记录 数 有 31026 条 , 索引 范围 为 0-31025。 
数据 字段 数 18 个 ,其 包含 的 数据 类 型 有 两 类 ,分别 有 float64 类 型 4 个 字段 ， 
object 类 型 字段 14 个 。 另 外 , 诸如 link, housetype, owner, price speciallabel 
等 字段 均 有 空 值 存在 。 

Go 查看 数据 源 是 否 有 重复 数据 ， 这 里 ， 假 定 以 tile 字段 为 关键 字 ， 
若 标题 内 容 相 同 ， 则 认为 是 同一 记录 。 

>>> len(df.title.unique()) 

25793 


>>> 


运行 结果 如 图 13.24 所 示 。 
>>> len(df.title.unique()) 
25793 
>>> 
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e— 第 13 项 目 实战 : 数据 分 析 


[ly Python 3.6.5 She 
File Edit Shell Debug Options Window Help. 
>>> df.info() 
«class 'pandas.core.frame.DataFrame'» 
Rangelndex: 31026 entries, O to 31025 
Data columns (total 18 columns): 
title 30973 non-null object 
mastermap 30973 non-null object 
link 30973 non-null object 
housetype — 30973 non-null object 
floor 30973 non-null object 
orientation — 30558 non-null object 
yearbuilt 30393 non-null float64 
city 31026 non-null object 
district 31026 non-null object 
Street 31026 non-null object 
community 30973 non-null object 
address 30973 non-null object 
owner 30257 non-null object 
area 30973 non-null float64 
price 30973 non-null float64 
unitprice — 30973 non-null float64 
pageaddr 31026 non-null object 
speciallabel 24648 non-null object 
dtypes: float64(4), object(14) 
memory usage: 4.3+ MB 
>>> 

13.23 数据 源 info() 


如 图 13.23 所 示 , 不 难 发 现 , 记录 数 有 31026 条 , 索引 范围 为 0-31025。 
数据 字段 数 18 个 ,其 包含 的 数据 类 型 有 两 类 ,分别 有 float64 类 型 4 个 字段 ， 
object 类 型 字段 14 个 。 另 外 , 诸如 link, housetype, owner, price speciallabel 
等 字段 均 有 空 值 存在 。 

Go 查看 数据 源 是 否 有 重复 数据 ， 这 里 ， 假 定 以 tile 字段 为 关键 字 ， 
若 标题 内 容 相 同 ， 则 认为 是 同一 记录 。 

>>> len(df.title.unique()) 

25793 


>>> 


运行 结果 如 图 13.24 所 示 。 
>>> len(df.title.unique()) 
25793 
>>> 
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如 图 13.24 所 示 ， 显 示 不 重复 记录 数 为 23793 条 。 
(4) 接 下 来 ， 通 过 使 用 drop duplicates0) 清 洗 掉 数 据 源 中 的 重复 记录 ， 
并 通过 info0 验 证 结果 ， 如 图 13.25 所 示 。 


>>> df duplicates =df.drop_duplicates(subset = 'title' keep -'first") 
>>> df duplicates.info() 


«class 'pandas.core.frame.DataFrame'» 
Int64Index: 25793 entries, O to 31023 
Data columns (total 18 columns): 

title 25792 non-null object 
mastermap 25792 non-null object 
link 25792 non-null object 
housetype 25792 non-null object 
floor 25792 non-null object 
orientation 25404 non-null object 
yearbuilt 25335 non-null float64 


city 25793 non-null object 
district 25793 non-null object 
Street 25793 non-null object 
community 25792 non-null object 
address 25792 non-null object 
owner 25263 non-null object 
area 25792 non-null float64 
price 25792 non-null float64 
unitprice 25792 non-null float64 
pageaddr 25793 non-null object 


speciallabel 20598 non-null object 
dtypes: float64(4), object(14) 
memory usage: 3.7+ MB 


图 13.25 ”数据 源 去 重 统计 信息 

这 里 ，drop_duplicates 函数 通过 subset 参数 选择 以 哪个 列 为 去 重 基准 。 
keep 参数 则 是 保留 方式 ，first 是 保留 第 一 个 ， 删 除 后 余 重复 值 ，last 是 删除 
前 面 ， 保 留 最 后 一 个 。 

C50 处 理 字段 空 值 , 这 里 为 了 方便 , 直接 用 字段 空 值 处 理 函 数 dropna()， 
删除 含有 空 值 的 行 。 

不 过 ， 一 般 情 况 下 ， 对 于 数值 数据 ， 最 好 用 其 列 值 的 平均 值 蔡 代 空 值 。 
求 均值 用 到 的 统计 函数 是 mean()， 有 兴趣 的 朋友 可 以 尝试 ， 这 里 不 再 闭 述 。 

>>> df notnull = df duplicates.dropna() 

>>> df notnull.info() 


通过 查看 info() 查 看 数据 框 最 新 基本 情况 ， 如 图 13.26 所 示 。 


«class 'pandas.core.trame.DataFrame'» 
Int64Index: 19520 entries, 1 to 31023 
Data columns (total 18 columns): 
title 19520 non-null object 
mastermap 19520 non-null object 
link 19520 non-null object 
housetype 19520 non-null object 
floor 19520 non-null object 
orientation 19520 non-null object 
yearbuilt 19520 non-null float64 
city 19520 non-null object 
district 19520 non-null object 
Street 19520 non-null object 
community 19520 non-null object 
address 19520 non-null object 
owner 19520 non-null object 
area 19520 non-null float64 
price 19520 non-null float64 
unitprice 19520 non-null float64 
pageaddr 19520 non-null object 
speciallabel 19520 non-null object 
dtypes: float64(4), object(14) 
memory usage: 2.8+ MB 


1326 ”清洗 完毕 的 数据 信息 


不 难 发 现 ，19520 空 值 数据 行 已 完成 清理 。 
(6) 至 此 ， 数 据 清洗 完毕 ， 接 下 来 ， 根 据 自 己 的 分 析 主 题 来 选择 需要 
的 字段 。 这 里 , 以 housetype、 floor, orientation, yearbuilt, Street, community, 
area, unitprice 为 主题 字段 ， 创 建 df_clean 数据 。 
>>> df clean = df duplicates[['housetype','floor''orientation','yearbuilt''Street', 
'area','unitprice']] 
>>> df clean.head() 


如 图 13.27 所 示 为 主题 数据 前 5 条 记录 ， 这 里 head0 函 数 默 认 显示 5 条 。 


人 wp 


>>> 


floor orientation yearbuilt Street area unitprice 


3 室 2 厅 高 层 ( 共 28 层 ) 南北 向 ”2012.0 北大 明 宫 118.0 


高 层 ( 共 32 层 ) 西北 向 ”2011.0 北大 明 宫 88.0 


13.27 ”head() 演 示 效 果 


实战 : 数据 分 析 


19.492 
15.988 
-低层 ( 共 33 层 ) 南 向 ”2017.0 北大 明 宫 740 21.074 

”中 层 ( 共 11 层 ) 南北 向 ”2014.0 北大 明 宫 175.0 20.000 


中层 ( 共 33 层 ) 南北 向 ”2014.0 北大 明 宫 138.0 15.652 


CD 运用 统计 函数 统计 df clean 数据 的 字段 取 值 情况 ， 如 统计 房子 的 
建造 时 间 分 布 情况 。 

如 图 13.28 所 示 为 房屋 建筑 时 间 统 计 结果 。 

>>> df clean.yearbuilt.value counts() 


255 一 * 
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2013.0 4119 1998.0 509 
2012.0 2068 2018.0 455 
2010.0 2060 20010 405 
2008.0 1829 1999.0 195 
2011.0 1670 

2009.0 1470 20190 109 
2005.0 1457 1996.0 63 
2006.0 1321 1995.0 36 
2007.0 1086 20200 14 
20140 951 19970 12 
2004.0 933 1992.0 6 
2015.0 830 19900 3 
20000 a 19940 2 
2002.0 794 1988.0 2 
2003.0 740 1986.0 1 
2016.0 578 Name: yearbuilt, dtype: int64 


图 13.28 ” 房 龄 统计 结果 图 
(D 为 了 直观 ， 我 们 用 直方 图 将 其 图 像 化 展示 ， 如 图 13.29 所 示 。 


>>> import matplotlib.pyplot as plt 

>>> plt.style.use('ggplot') 

>>> df clean.yearbuilt.hist() 

«matplotlib.axes. subplots.AxesSubplot object at OX000002BF8F604E48»- 
>>> plt.show() 
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1329 ” 房 龄 分 布 直方 图 
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如 上 图 ,我 们 可 以 直观 地 看 到 , 二手 房 的 建筑 时 间 主 要 集中 于 2010 年 一 
2014 年 。 这 正好 和 我 们 用 value_counts0 统 计 函 数 的 计算 结果 吻合 。 
(9) 可 以 通过 箱 线 图 更 为 微观 地 观察 建筑 时 间 和 楼 房 数量 的 分 布 关系 。 


>>> df clean.boxplot(column = 'unitprice',by='yearbuilt') 
*matplotlib.axes. subplots.AxesSubplot object at 0x000002BF90F73AC8> 
>>> plt.show() 
>>> from matplotlib.font manager import FontProperties 
>>> font zh = FontProperties(fname -"msyahei.ttf") 
>>> df label = df clean.boxplot(column = 'yearbuilt',by-'Street") 
>>> for label in df label.get xticklabels(): 
label.set fontproperties(font zh) 
>>> plt.show() 


显示 结果 如 图 13.30 所 示 。 
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13.30 ” 房 龄 箱 线 图 

如 图 13.30 所 示 , 可 以 更 为 直观 地 观察 到 不 同 区 域 房 屋 数量 和 建筑 时 间 
的 关系 分 布 情况 。 

这 里 需要 说 明 的 是 : 

@ 由 于 地 址 中 的 汉字 比较 多 ， 导 致 地 址 显示 县 加 ， 有 点 小 bug， 此 时 ， 
需要 调整 横 轴 坐标 , 让 其 顺 时 针 旋 转 90"， 即 可 正常 显示 ,如 图 13.31 所 示 。 

>>> plt.xticks(rotation = 90) 

@ 箱 线 图 需要 正确 显示 汉字 ， 就 需要 对 FontProperties 字体 属性 进行 设 
置 ， 否 则 会 乱码 。 
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13.31 ”调整 横 坐标 后 的 地 域 房 龄 统计 图 


接 下 来 ， 针 对 房子 的 单价 进行 快速 统计 汇总 ， 这 里 单位 是 (K)， 如 图 
13.32 所 示 。 
>>> df clean.unitprice.describe() 


1985 


count 25792.000000 

mean 14.500382 

std 10.561374 

min 2.604000 

2596 10.902250 

50% 13.500000 

75% 17.026000 

max 1431.053000 

Name: unitprice, dtype: float64 
>>> 


图 13.32 ”房价 的 快速 统计 汇总 信息 

由 图 13.32 可 知 ， 房 价 中 的 非 空 记录 数 为 25 792， 房 价 的 均值 为 
14.500382。 其 标准 差 约 为 10.561374， 最 低 值 约 为 2.604， 最 大 值 约 为 
1431.053, 较 小 四 分 位 数 为 10.90225, 中 位 数 为 13.5, 较 大 四 分 位 数 为 17.026。 

俗话 说 得 好 ,“ 买 房 买 位 置 ”"。 经 过 上 面 的 统计 分 析 ， 我 们 对 西安 市 的 
二 手 房 以 房 龄 和 位 置 为 重点 进行 了 细致 的 研究 ， 并 且 对 市 场 价格 也 进行 了 
初步 的 估算 。 相 信 大 家 去 哪里 买 想必 心中 有 数 了 吧 ， 当 然 ， 也 可 以 继续 用 
我 们 的 工具 去 实现 您 的 需求 。 


135 实验 


1. 实验 目的 
@ 掌 握 NumpPy 库 的 安装 方法 和 注意 事项 , 熟练 掌握 其 对 应 的 数组 对 象 


ndarray 的 基本 操作 。 

日 掌握 数据 分 析 的 基本 步骤 ， 能够 熟练 使 用 NumPy 完成 简单 的 数据 分 
析 工 作 。 

2. 实验 内 容 

实验 一 ”NumPy 的 安装 与 使 用 

ONumPy 的 安装 。 

使 用 pip install 完成 NumPy 科学 计算 库 安装 。 

ONumPy 的 使 用 。 

使 用 NumPy 提供 的 ndarray 数组 对 象 分 别 创建 两 个 一 维 数组 ， 利 用 
NumPy 提供 的 方法 完成 对 应 数组 的 四 则 运算 。 

实验 二 ”基于 Pandas 的 数据 分 析 

使 用 Pandas 库 所 提供 的 方法 对 第 11 章 所 采集 的 Top500 数据 进行 如 下 
操作 。 

@ 将 采集 的 数据 存 入 Excel. 电子 表格 。 

@ 通 过 Pandas 对 象 方法 对 Excel 电子 表格 中 的 数据 进行 清洗 处 理 。 

@ 将 清洗 完毕 的 数据 通过 Pandas 对 象 进行 可 视 化 操作 。 
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Python 代码 风格 
指南 : PEP8 


PEP8 是 Python 官方 的 编码 风格 。 其 源 于 对 Python 良好 编码 风格 的 研 
究 ， 遵 循 这 种 风格 能 够 使 写 出 来 的 Python 代码 更 加 可 读 ， 进 而 容易 维护 。 
下 面 以 官方 PEP8 文档 为 指南 ， 开 始 进行 Python 的 代码 风格 之 旅 。 

1. 代码 编排 

O 缩 进 。4 个 空格 的 缩 进 〈 编 辑 器 都 可 以 完成 此 功能 )， 不 使 用 Tap, 
更 不 能 混合 使 用 Tap 和 空格 。 

@ 每 行 最 大 长 度 为 79， 换 行 可 以 使 用 反 斜 枉 ， 最 好 使 用 圆 括号 。 换 行 
点 要 在 操作 符 的 后 边 按 Enter 键 。 

@ 类 和 top.level 函数 定义 之 间 空 两 行 ， 类 中 的 方法 定义 之 间 空 一 行 ， 
函数 内 逻辑 无 关 段落 之 间 空 一 行 ， 其 他 地 方 尽量 不 要 再 空 行 。 

2. 文档 编排 

@ 模 块 内 容 的 顺序 : 模块 说 明和 docstring—import— globals&constants 
一 其 他 定义 。 其 中 import 部 分 又 按 标 准 、 三 方 和 自己 编写 顺序 依次 排放 ， 
之 间 室 一 行 。 

日 不 要 在 一 个 import 语句 中 导入 多 个 Python 库 ， 如 import os, sys 不 
推荐 。 

@ 如 果 采 用 from XX import XX 引用 库 ， 可 以 省 略 module.， 这 可 能 出 
现 命名 冲突 ， 这 时 就 要 采用 import XX。 

3. 空格 的 使 用 

@ 各 种 右 括号 前 不 要 加 空格 。 
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@ 逗 号、 冒号、 分 号 前 不 要 加 空格 。 

日 函数 的 左 括号 前 不 要 加 空格 ， 如 Func(1). 

日 序列 的 左 插 号 前 不 要 加 空格 ， 如 list[2]。 

@ 操 作 符 左右 各 加 一 个 空格 ， 不 要 为 了 对 齐 增加 空格 。 

日 函数 默认 参数 使 用 的 赋值 符 左右 省 略 空格 。 

@ 不 要 将 多 句 语句 写 在 同一 行 ， 尽 管 允 许 使 用 分 号 〈; )。 

Oif/for/while 语句 中 ， 即 使 执行 语句 只 有 一 句 ， 也 必须 另 起 一 行 。 

4. 注释 

错误 的 注释 不 如 没有 注释 。 所 以 当 一 段 代 码 发 生变 化 时 ， 第 一 件 事 就 
是 要 修改 注释 。 

@ 与 代码 自 相 矛 盾 的 注释 比 没 注释 更 差 。 修 改 代码 时 要 优先 更 新 注释 。 

日 注释 是 完整 的 句子 。 如 果 注 释 是 断 句 ， 首 字母 应 该 大 写 ， 除 非 它 是 
小 写字 母 开头 的 标识 符 〈 永 远 不 要 修改 标识 符 的 大 小 写 )。 

@ 如 果 注 释 很 得 ， 可 以 省 略 末尾 的 句号 。 注 释 块 通常 由 一 个 或 多 个 段 
落 组 成 。 段 落 由 完整 的 句子 构成 且 每 个 句子 应 该 以 点 号 〈 后 面 要 有 两 个 空 
格 ) 结束 ， 并 注意 断 词 和 空格 。 

@ 非 英语 国家 的 程序 员 请 用 英语 书写 你 的 注释 ,除非 你 120% 确 信 代 码 
永远 不 会 被 不 懂 你 的 语言 的 人 阅读 。 

@ 注 释 块 通常 应 用 在 代码 前 ， 并 和 这 些 代码 有 同样 的 缩 进 。 每 个 注释 
行 以 #《〈 除 非 它 是 注释 内 的 缩 进 文本 ， 注 意 # 后 面 有 空格 ) 符号 开始 。 注 释 
块 内 的 段落 用 仅 包含 单个 n 的 行 分 割 。 

@ 慎 用 行内 注释 Online Comments)， 节 俭 使 用 行内 注释 。 行 内 注释 是 
和 语句 在 同一 行 ， 至 少 用 两 个 空格 和 语句 分 开 。 行 内 注释 不 是 必需 的 ， 重 
复 喝 唆 会 使 人 分 心 ， 不 要 这 样 做 。 

5. 命名 规范 

@ 尽 量 单独 使 用 小 写字 母 1、 大 写字 母 O 等 容易 混淆 的 字母 。 

@ 模 块 命名 尽量 短小 ， 使 用 全 部 小 写 的 方式 ， 可 以 使 用 下 画 线 。 

@ 包 命名 尽量 短小 ， 使 用 全 部 小 写 的 方式 ， 不 可 以 使 用 下 画 线 。 

日 类 的 命名 使 用 CapWords 的 方式 ， 模 块 内 部 使 用 的 类 采用 _CapWords 
的 方式 。 

日 异常 命名 使 用 CapWords+Error 后 级 的 方式 。 

@ 全 局 变量 尽量 只 在 模块 内 有 效 ， 类 似 C 语言 中 的 static。 实 现 方法 有 
两 种 ， 一 是 _all_ 机 制 ， 二 是 前 组 一 个 下 画 线 。 

@ 函数 命名 使 用 全 部 小 写 的 方式 ， 可 以 使 用 下 画 线 。 

@ 常 量 命名 使 用 全 部 大 写 的 方式 ， 可 以 使 用 下 画 线 。 

@ 类 的 属性 〈 方 法 和 变量 ) 命名 使 用 全 部 小 写 的 方式 ， 可 以 使 用 下 


线 


El 


@ 类 的 属性 有 3 种 作用 域 ， 分 别 是 public、non.public 和 subclass API, 
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可 以 理解 成 C++ 中 的 public. private. protected, non.public 属性 前 ， 前 级 一 
条 下 画 线 。 

日 类 的 属性 若 与 关键 字 名 字 冲 突 ， 后 级 一 条 下 画 线 ， 尽 量 不 要 使 用 缩 
略 等 其 他 方式 。 

O 为 避免 与 子 类 属性 命名 冲突 , 在 类 的 一 些 属性 前 , 前 缀 两 条 下 画 线 。 
例如 ， 类 Foo 中 声明 _a， 访 问 时 ， 只 能 通过 Foo. Foo a， 避免 歧 义 。 如 
果子 类 也 叫 Foo， 那 就 无 能 为 力 了 。 

@ 类 的 方法 第 一 个 参数 必须 是 self， 而 静态 方法 第 一 个 参数 必须 是 cls。 

6. 编码 建议 

@ 编 码 中 考虑 到 其 他 Python 实现 的 效率 等 问题 ， 如 运算 符 + (加 号 ) 在 
CPython (Python) 中 效率 很 高 ， 但 是 在 Python 中 却 非常 低 ， 所 以 应 该 采 
用 join0) 的 方式 。 

@ 尽 可 能 使 用 is 或 is not 取代 ==， 如 ifxis not None 要 优 于 if xo 

@ 使 用 基于 类 的 异常 ， 每 个 模块 或 包 都 有 自己 的 异常 类 ， 此 异常 类 继 
承 自 Exception。 

日 异常 中 不 要 使 用 裸露 的 except, except 后 要 跟 具 体 的 exceptions. 

以 上 内 容 源 于 PEP 8 Style Guide for Python Code， 详 见 官网 : 
https://www.python.org/dev/peps/pep-0008/。 

这 里 需要 特别 说 明 的 是 ，Python 语言 是 强 格式 语言 ， 大 家 需要 特别 注 
意 ， 不 然 经 常会 报 出 格式 错误 。 


附录 B 


IPython 指南 


1. IPython 简介 

IPython 是 一 个 Python 的 交互 式 shell， 比 默认 的 python shell 好 用 得 
多 ， 支 持 变量 自动 补 全 ， 自 动 缩 进 ， 支 持 bash shell 命令 ， 内 置 了 许多 很 
有 用 的 功能 和 函数 。IPython 是 基于 BSD 开源 的 。IPython 为 交互 式 计算 


提供 了 一 


m] 
ü 
ü 
ü 
ü 


个 丰富 的 架构 ， 主 要 包含 以 下 几 个 部 分 。 
强大 的 交互 式 shell。 

Jupyter 内 核 。 

交互 式 的 数据 可 视 化 工具 。 

灵活 、 可 嵌入 的 解释 器 。 

易于 使 用 ， 高 性 能 的 并 行 计算 工具 。 


2. IPython 安装 

IPython 是 以 Python 为 基础 运行 环境 的 。 因 此 ， 安 装 IPython 之 前 ， 首 
先 应 当 正 确 安装 Python 开发 环境 。 关 于 IPython 的 安装 方法 也 有 两 种 方式 ， 
一 种 是 直接 到 其 官网 下 载 压 缩 包 ， 运 行 setuppy 进行 安装 ， 另 一 种 是 使 用 
pip install 命令 进行 安装 。 这 里 采用 pip install 命令 方式 , 如 图 B.1 所 示 ( 官 
网 地 址 : http://ipython.org/)。 

这 里 安装 的 版 本 是 ipython.6.4.0。 

3. IPyton 的 运行 

在 Windows 10 平台 下 ， 按 Win+R 快捷 键 ， 打 开 “ 运 行 ” 对 话 框 ， 输 
入 CMD 并 确定 ， 进 入 DOS 对 话 框 ， 在 提示 符 下 输入 ipython 命令 ， 即 可 
进入 IPython Shell， 如 图 B.2 所 示 。 


pyth 


3c09. 2 Y D 300 64 bit (AMD64)] 


B.2 IPython Shell 


如 图 B.2 所 示 ， 即 可 在 其 中 进行 Python 编程 。 
4. IPython 快捷 键 


ü 


口 


DODODODO DOD 


Ctrl+P《〈 或 上 箭头 键 ) : 后 向 搜索 命令 历史 中 以 当前 输入 的 文 
本 开头 的 命令 。 

CtrlHN (或 下 箭头 键 ) : 前 向 搜索 命令 历史 中 以 当前 输入 的 文 
本 开头 的 命令 。 

Ctrl+R: 按 行 读 取 的 反 向 历史 搜索 〈 部 分 匹配 ) 。 
Ctrl+ShifttV: 从 剪贴 板 粘贴 文本 。 

Ctrl-C: 中 止 当前 正在 执行 的 代码 。 

Ctrl+A: 将 光标 移动 到 行 首 。 
Ctrl+E: 将 光标 移动 到 行 尾 。 
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Ctrl+K: 删除 从 光标 开始 至 行 尾 的 文本 。 
Ctrl+U: 清除 当前 行 的 所 有 文本 译注 12。 
Ctrl+F: 将 光标 向 前 移动 一 个 字符 。 
Ctrl+b: 将 光标 向 后 移动 一 个 字符 。 
O CtrltL: 清 屏 。 
5. IPython 魔术 命令 
在 IPython 的 会 话 环 境 中 ， 所 有 文件 都 可 以 通过 %run 命令 来 当做 脚 
本 执行 ， 并 且 文 件 中 的 变量 也 会 随即 导入 当前 命名 空间 。 即 ， 对 于 一 个 模 
块 文件 ， 你 对 它 使 用 %run 命令 的 效果 和 from module import * 相同 ， 除 
非 这 个 模块 文件 定义 了 main. 函数 Gif name ='main:'), 在 这 种 情况 下 main 
函数 还 会 被 执行 。 这 种 以 % 开头 的 命令 在 Python 中 被 称 为 魔术 命令 ， 
用 于 加 强 Shell 的 功能 。 常 用 的 魔术 命令 如 下 。 
O %quickref: 显示 IPython 快速 参考 。 
%magic: 显示 所 有 魔术 命令 的 详细 文档 。 
%debug: 从 最 新 的 异常 跟踪 的 底部 进入 交互 式 调试 器 。 
%pdb: 在 异常 发 生 后 自动 进入 调试 器 。 
%reset: 删除 interactive 命名 空间 中 的 全 部 变量 。 
%run script.py: 执行 script.py。 
%prun statement: 通过 cProfile 执行 对 statement 的 逐 行 性 能 
分 析 。 
%time statement: 测试 statement 的 执行 时 间 。 
%timeit statement: 多 次 测试 statement 的 执行 时 间 并 计算 平均 值 。 
口 %who、%who_ls、%whos: 显示 interactive 命名 空间 中 定义 
的 变量 ， 信 息 级 别 / 宛 余 度 可 变 。 
O %xdel variable: 删除 variable， 并 尝试 清除 其 在 IPython 中 的 
对 象 上 的 一 切 引用 。 
!cmd: 在 系统 Shell 中 执行 cmd. 
output-!cmd args: 执行 cmd 并 赋值 。 
%bookmark: 使 用 IPython 的 目录 书签 系统 。 
%cd direcrory: 切换 工作 目录 。 
%pwd: 返回 当前 工作 目录 (字符 串 形式 ) 。 
O %env: 返回 当前 系统 变量 〈 以 字典 形式 ) 。 
另外 ， 如 果 对 魔术 命令 不 熟悉 ， 可 以 通过 %magic 查看 详细 文档 对 
某 一 个 命令 不 熟悉 ， 可 以 通过 %cmd? 内 省 机 制 查看 特定 文档 。 值 得 一 提 
的 是 ，IPython 中 使 用 del 命令 无 法 删除 所 有 的 变量 引用 ， 因 此 垃圾 回收 机 
制 也 无 法 启用 ， 所 以 有 些 时 候 会 需要 使 用 %xdel 或 者 %reset。 


DODUDO 


Do 


DODCCDOCUO 
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6.IPython 调试 器 命令 GÈ B.1 所 示 ) 
表 B.1 Ipython 调用 器 命令 


M 令 功 能 
help 显示 命令 列表 
help command 显示 command 的 文档 
c(ontinue) 恢复 程序 的 执行 
q(uit) 退出 调试 器 ， 不 再 执行 任何 代码 
b(reak) number 在 当前 文件 的 第 number 行 设置 一 个 断 点 
bpath/to/file.py:number 在 指定 文件 的 第 number 行 设 置 一 个 断 点 
s(tep 单 步 进 入 函数 调用 
n(ext 执行 当前 行 ， 并 前 进 到 当前 级 别 的 下 一 行 
u(p)/d(own: 在 函数 调用 栈 中 向 下 或 向 上 移动 
a(rgs 显示 当前 函数 的 参数 
debug statement 在 新 的 (递归 ) 调试 器 中 调用 语句 statement 
Ist) statement 显示 当前 行 ， 以 及 当前 栈 级 别 上 的 上 下 文 参 
考 代码 
打印 当前 位 置 的 完整 栈 跟踪 包括 上 下 文 参考 
w(here) 代码 


XT IPython 的 其 他 信息 请 查阅 官方 帮助 文档 ， 如 图 B.3 所 示 。 


) ipython.org 


I P [y]: IPython Computing 


Install - Documentation - Project - Jupyter - News - Cite - Donate - Books 


Documentation 


IPython documentation is now hosted on the Read the Docs service. 


Other pieces 


Many pieces which were previously part of IPython were split out in version 4, and now have their own 
documentation. 


* lupyter includes: 


* The Jupyter notebook and notebook file format 


* The Jupyter Q! sole 
* The kernel mes: a protocol 


* Many other components 


* invnarallel (formerly 1,ythos.paralie2) 

* ipykernel (minimal docs, only release notes for the ipykernel package) 
* invwidgets (formerly 1,ytos.htx1 widgets) 

* Traitlets, the config system used by IPython and Jupyter 


Documentation for older releases 


图 B.3 帮助 文档 


Pycharm 指南 


1. 安装 方法 
详 见 第 1 章 上 机 实验 课 内容 ， 这 里 不 再 更 述 。 
2. 基本 配置 


(1) 在 PyCharm 下 为 Python 项 目 配置 Python 本 地 解释 器 。 
setting 一 Project:pycharm workspace— Project Interpreter 一 add local. 
(2) 在 PyCharm 下 创建 Python 文件 、Python 模块 。 
DD file—new- python file. 
DD file—new-- python packpage。 
(3) 使 用 PyCharm 安装 Python 第 三 方 模块 。 
setting— Project:pycharm workspace 一 Project Interpreter 一 单 击 右 侧 绿色 
小 加 号 搜索 要 添加 的 模块 一 安装 。 
(4) PyCharm 基本 设置 。 
口 不 使 用 tab，tab=4 空格 : setting 一 Editor 一 Code Style 一 Python 。 
U “字体 、 字 体 颜 色 : setting 一 Editor 一 Colors & Fonts- Python. 
O 关闭 自动 更 新 : setting 一 Appearance & Behavior 一 System 
Settings 一 Updates。 
(5) 脚本 头 设置 : setting— Editor— File and Code Templates 一 Python 
Script。 
Q £/usr/bin/env python. 
口 £.*.coding: ut£ 8 .*.. 
(6) 显示 行 号 : setting— Editor — General — Appearance — show line 


numbers. 
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3. 常用 快捷 键 
OcubC CE. 在 没 选择 范围 的 情况 下 会 复制 当前 行 ， 而 不 需要 
先 选择 整 行 再 复制 。 


@CtlHV (粘贴 ): Ctrl+ShifttV 可 以 在 剪贴 板 历史 中 选择 一 个 去 
粘贴 。 

@Ctl+X (IUD. 

OCHS (保存 )。 

QCtrltZ (撤销 )。 

OCulb-Shift-Z: 反 撤 销 。 

Ctrlt/ (注释 ): 注释 后 光标 会 自动 到 下 一 行 ， 方 便 注释 多 行 。 

OCubD (复制 行 )。 

@Ctrl+ShiftHU 〈 转 换 大 小 写 )。 

@CtrlHAlttL (格式 化 )。 

CtrltAlttO【〔 优 化 import) 

ShifttAlt. t } (上 下 移动 行 ); ShifttCtrl+ 1 | (上 下 移动 语句 。 
一 个 语句 可 能 有 多 行 。 并 且 会 决定 要 不 要 进 块 内 和 出 块 外 ): 简单 地 说 ， 一 
个 是 物理 移动 行 ， 一 个 是 逻辑 移动 语句 。 

ShifttEnter (在 下 面 新 开 一 行 ); Ctrl+Alt+Enter (在 上 面 新 开 一 行 )。 

OAlt--—-- (单词 级 别 的 移动 ); Ctrl+ 一 一 ( 行 首 / 行 尾 ); Shift+ 一 一 
(左右 移动 带 选择 );， Ctrl+[] GREE); cmd+ 1 } (上 一 个 方法 /下 一 个 
方法 )。 

@cmd+L (Find/Move to next Occurrence)» 

昌 右 侧 竖 线 是 PEP8 的 代码 规范 ， 提 示 一 行 不 要 超过 120 个 字符 。 

昌 导 出 、 导 入 自 定义 的 配置 : File 一 Export Settings. Import Settings。 


